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Эта книга посвящена в основном новейшим результатам 
эргодической теории, связанным в первую очередь с теоре- 
тико-информационными методами исследования динамиче- 
ских систем. Изложив основные понятия эргодической тео- 
рии (сохраняющего меру преобразования, эргодичности, пере- 
мешивания и т. п.), автор переходит к определению энтро- 
пии динамической системы. Далее вводится понятие условной 
энтропии, описываются ее свойства, дается теорема Макмил- 
лана и рассматриваются связи между понятием размерности 
в смысле Хаусдорфа и понятием энтропии. В заключение 
излагаются основные положения общей теории связи в смысле 
Шеннона и обсуждаются соответствующие вопросы эргоди- 
ческой теории. 

Книга написана ясно и не требует от читателя большой. 
математической подготовки. Она, безусловно, заинтересует 
математиков многих специальностей. 
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Предисловие редактора перевода 


Теория, основам которой посвящена эта книга, отметила 
в 1968 г. свое десятилетие. Введение А. Н. Колмогоровым 
десять лет назад понятия энтропии преобразования с инва- 
риантной мерой не только позволило ему решить давно 
поставленную конкретную задачу, но положило начало 
новому — энтропийному—направлению эргодической теории, 
ставшему вскоре в ней ведущим. Даже последующие дости- 
жения в традиционных для эргодической теории вопросах 
обязаны энтропийному направлению возрождением интереса 
математиков к эргодической теории в целом. 

Книга профессора Биллингслея, написанная с большим 
педагогическим мастерством, представляет собой первое на 
русском языке изложение основ энтропийной теории пре- 
образований с инвариантной мерой, доступное начинаю- 
щему. От читателя требуется лишь владение абстрактным 
интегралом Лебега и элементарными понятиями теории 
вероятностей. Автор подробно излагает теорию условных 
вероятностей, и соответствующие параграфы можно реко- 
мендовать для первоначального ознакомления с предметом 
даже тем из читателей, кого основное содержание книги 
не заинтересует. 

Хотя перед нами книга учебного характера и в нее не вклю- 
чены многие глубокие результаты энтропийной теории (с этими 
результатами можно познакомиться по обзорной статье 
В. А. Рохлина „Лекции по энтропийной теории преобра- 
зований с инвариантной мерой“, УМН, 5 (1967)), кое-что 
в ней может заинтересовать и специалиста, в частности 
помещенная в гл. 3 теорема Биллингслея о связи энтропии 
сдвига с хаусдорфовой размерностью. 

В книге разобрано довольно много примеров. Одному 
из них — эндоморфизму, возникающему в связи с представ- 
лением вещественного числа непрерывной дробью, посвя- 
щен заключительный параграф гл. |. Здесь имеется KOM- 
пактное изложение основных результатов метрической теории 


*> 66 


непрерывных дробей, написанное с „эргодической“ точки 
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зрения. Почти все остальные примеры вероятностного про- 
исхождения, и поэтому у читателя может возникнуть впе- 
чатление, что энтропийная теория имеет дело преимуще- 
ственно лишь с такого рода примерами. В действительности 
же не менее важной и интересной областью ее применения 
являются диффеоморфизмы гладких многообразий. 

В небольшом приложении, написанном Я. Г. Синаем и 
автором этих строк и помещенном в конце книги, рассмат- 
ривается один класс таких преобразований—алгебраические 
автоморфизмы N-MepHoro тора. Материал этого приложения 
поможет читателю ‘получить представление о характере 
применения энтропии и связанных с ней понятий к гладким 
преобразованиям. Используемый метод основан на понятии 
марковского разбиения, недавно введенном и изученном 
Я. Г. Синаем. 

_ Можно надеяться, что выход в свет книги Биллингслея 
расширит круг лиц, интересующихся эргодической теорией, 
и окажет помощь всем, кто захочет ее изучить. 


΄ 


= Б. Гуревич 


Предисловие к английскому изданию 


Мне очень приятна возможность в нескольких словах пред- 
ставить книгу Патрика Биллингслея, первую в новой серии 
«Монографий по теории вероятностей и математической 
статистике» (Tracts on Probability and Mathematical Sta- 
tistics). | 

Эта книга возникла из цикла лекций, прочитанных про- 
фессором Биллингслеем на учебных конференциях Лондон-_ 
ского математического общества, лекций, которые, как нам 
‘кажется, должны стать достоянием более широкой публики. 
Особенно удачно, что новую серию открывает именно эта 
книга, поскольку и «Монографии» и конференции Лондон- 
ского математического общества стремятся сделать новые 
математические достижения общедоступными еще на той 
стадии, когда в них бьется живой пульс, прежде чем они 
примут застывшую форму. 

Мы надеемся сохранить умеренный объем всех книг этой 
серии. Большинство возможных авторов отпугивает мысль 
о необходимости написать, отпечатать и прокорректировать 
сотни страниц математического текста. Нет сомнения в том, 
что много прекрасных математических книг никогда не были 
написаны именно по этой причине, а также потому, что для. 
тех, кто должны были быть их авторами, оказалось невоз- 
можным оторваться от преподавания и исследовательской 
работы на срок, необходимый для написания исчерпываю- 
щего трактата. 

Мы надеемся также внести этой серией вклад в улуч- 
шение существующих стандартов в области планирования 
и издания математических книг. Книга бесполезна, если 
ее не читают. Издатели убеждены, что недостаточно только 
захватывающего сюжета и мастерства; сам текст должен 
быть представлен привлекательно, что определенно спо- 
собствует пониманию рассуждений. Это вопрос не эстетики, 
а доступности, и мы думаем, что он заслуживает большего 
внимания. 


Кембридж, Англия = | Дэвид Кендалл 


Введение 


Эта книга выросла из обзора!) эргодической теории и тео- 
рии информации, который должен был следовать за крат- 
ким курсом теории вероятностей на основе теории меры. 

В гл. | рассматривается эргодическая теорема. Глава 2 
` посвящена данному Колмогоровым и Синаем приложению 
шенноновской энтропии к проблеме изоморфизма в эргоди- 
ческой теории. В противоречии с исторической последова- 
тельностью эти ‘идеи только потом (в гл. 4 и 5) применяются 
к теории информации и теории кодирования. Результаты, 
относящиеся к кодированию, не претендуют на особую глу- 
бину; я ставил своею целью возможно теснее связать тео- 
рию кодирования и эргодическую теорию, избегая техниче- 
ских подробностей. Связь между этими двумя теориями 
является той нитью, которая связывает все параграфы 
КНИГИ. 

С самого начала предполагается, что читатель знаком 
с пространством (©, ¥, Р). Впрочем, чтобы сократить 
ссылки на теорию меры, я включил (гл. 3) описание услов- 
ных вероятностей и математических ожиданий относительно 
0-поля и отметил звездочкой те темы, которые могут быть 
опущены (конечно, звездочкой могла бы быть отмечена вся 
книга). 
_ Я пытался писать не для знатоков, а для новичков. 
Я пытался следовать блестящему примеру Харди и Райта, 
написавших свое «Ап introduction to the theory of numbers» 
с заранее поставленной целью (указанной в их предисловии) 
создать интересную книгу. 


Копенгаген, декабрь 1964 г. Патрик Биллингслей 
т) Курс лекций, представленных Лондонскому математическому обще- 


ству на учебной конференции по теории вероятностей, проходившей 
в Дёрем-Колледж с 28 марта по 11 апреля 1963 г. 


ГЛАВА 1 
Эргодическая теория 


1. ПРЕОБРАЗОВАНИЯ, СОХРАНЯЮЩИЕ МЕРУ 


Введение 


Случай необходимо связан с понятием изменчивости, но 
сами управляющие изменчивостью законы могут оставаться 
неизменными во времени: если рулетка не стареет со вре- 
менем, счастье улыбается игроку в соответствии с постоян- 
ными вероятностными законами. Эргодическая теория дает 
ключ к пониманию этих случайных изменений. | 

Бросание монеты, игральной кости, наблюдение длины 
очереди, определение числа молекул в данном объеме — 
вообразите любой из таких случайных экспериментов или 
наблюдений. Пространство состояний эксперимента есть 
множество р его возможных исходов: о состоит из герба и 
решетки, граней кости и т. п. Пусть наш эксперимент про- 
изводится, скажем, раз в минуту, и это продолжалось и 
будет продолжаться вечно. 

Бесконечную в обе стороны последовательность экспе- 
риментов можно рассматривать как один большой экспе- 
римент, исход которого представляет собой бесконечную 
в обе стороны последовательность © = (...., ®-1, Wp, Θι,.. .) 
`элементов множества о. Вероятностная структура этого 
большого эксперимента задается вероятностной мерой Р на 
пространстве Ω таких последовательностей '). 

Допуская возможность того, что исход каждого экспе- 
римента сильно влияет на исходы следующих за ним, мы 
хотим математически выразить идею, что течение времени 
не влияет на совместные распределения вероятностей, кото- 
рым подчиняется экспериментирование. Сдвигая последова- 
тельность Ὁ влево на один шаг, получаем новую последо- 
вательность ®’=(..., Wp, @1, ®.,...), в которой в; стоит 
на нулевом месте. Так как хи о’ — идентичные реализации 


') Трудно представить, как согласовать Р с частотной интерпрета- 
цией теории вероятностей: большой эксперимент не может быть повто- 
рен, так как проведение его занимает все время. Однако хотя беско- 
нечность последовательности компонент эксперимента математически 
существенна, в реальных ситуациях она не должна пониматься бук- 
вально. 
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большого эксперимента, отличающиеся только началом от- 
счета времени, то вероятностная мера Р должна припи- 
сывать Θ΄ ту же вероятность, что и ®, если вероятностные 
законы неизменны во времени. На самом деле ® и ®’ будут 
иметь, вообще говоря, вероятность 0, и нужно ‘требовать, _ 
чтобы при преобразовании 7, переводящем ὦ в ©’, вероят- 
ностная мера Р сохранялась в том смысле, что Р(А)=Р (ΤΑ) 
для множеств A. Это приводит нас к изучению преобразо- 
ваний, сохраняющих меру, — к эргодической теории. 

В этом параграфе, после того как будут даны первые 
определения, примеры (как из теории вероятностей, так и 
из других областей математики) и общие принципы, мы 
сформулируем эргодическую теорему, представляющую 
собой основной результат теории, и приведем примеры ее 
применения. В $2 содержатся доказательства эргодической 
теоремы, 8 Β $ Зи 4 — дальнейшие примеры и применения, 


Определения 


В эргодической теории изучаются преобразования, сохра- 
няющие структуру пространств с мерой. Мы будем зани- 
маться эргодической теорией в ее связи с теорией вероят- 
ностей и теорией информации и потому ограничимся 
рассмотрением вероятностных пространств. 

Пусть (©, «Я, Р) — вероятностное пространство!) и T— 
‚преобразование, отображающее © в себя, измеримое в том 


смысле, что из AGF следует. T A={o: ToSAe FY. 
Если, кроме того, Τ᾽ — взаимно однозначное преобразование, 
TQ=Q2 и из ACH следует ТА = {То: aL ASEH, το Τ 


называется обратимым. В случае когда Р(Т'А)=Р(А) для 
каждого A из οἵ, говорят, что Т — сохраняющее меру пре- 
образование; если Т обратимо, то эквивалентным требова- 
нием является P(TA)=P(A)?). 

_ (Даже если сохраняющее меру преобразование необра- 
THMO, JQ есть πο существу все О, так как TQCAG HF 


влечет за собой Т 'А=О и, следовательно, Р (4) =1. В част- 
ности, если TQ принадлежит ¥, то Р (ТО) = 1.) 


1) О— пространство точек 0, & —это σ-ποπε (т. е. в-алгебра) под- 
множеств из (ὁ, Р — вероятностная мера на οἵ. Об аксиоматическом по- 
строении теории вероятностей см., например, Колмогоров [1] или. Хал- 
мош [2, гл. Х]. 

2) By отечественной литературе принято называть измеримое сохра- 
няющее меру преобразование эндоморфизмом, а если оно к тому же 
‘обратимо, автоморфизмом. — Прил. ред. 
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Примеры 


Рассмотрим сначала два вероятностных примера. 
Пример 1.1.') Пусть © — конечное множество из г эле- 
ментов. Приписывая элементам множества р неотрицатель- 


ные вероятности р; так, что > т i; мы получаем вероят- 
тер 


ностную меру Ha ф (вернее на о0-поле всех подмножеств 


множества 0). Пусть (©, «Я ,Р) есть произведение П On 


2 п=-— со 
пространств о,, каждое из которых совпадает с 0. Произ- 
вольный элемент пространства Q является бесконечной в обе 
стороны последовательностью ®=(..., Wj, Wp, ®,...) эле- 
ментов множества ©. Пусть x, — функция, ставящая в соот- 
ветствие точке ® = значение ®„ её п-й координаты. Функ- 
цию xX, называют и-й координатной функцией. Конечно 
аддитивное поле, состоящее из цилиндров, т. е. множеств 
вида 


о: (и, (в), «65 Хиз-1 (6) ) = Е} = {ω: (®,,..., Фь1) © Е}, 


где Е— подмножество прямого произведения 0”, порождает 
σ-ποπε οἵ. Но о-поле οἵ порождается также совокупностью 
множеств, которые мы назовем „тонкими“ цилиндрами, т. е. 
множеств вида {@: Χχ(ω) =й, n<l<n+h}, где i; — элементы 
множества 0; в самом деле, каждый цилиндр является 
конечным объединением непересекающихся тонких цилин- 
дров. Наконец, мера Р определяется совокупностью ее зна- 


чений на тонких цилиндрах ?): 
n+k—1\ 


P{o: x,(0) =i, n<l<n+hk}= Η Pip (1.1) 


Итак, {..., X21, Χο, Χι, ...} является последовательностью 
независимых случайных величин со значениями из ©. Пусть 
_Т: 9—0 - отображение, переводящее (..., ®_1, Ωρ, Θι,...) 
в (..., Ωρ, ©, ©., ...). Более точно Т определяется COOTHO- 
шением (То), = @n4;, или (что то же самое) X, (TO) = хи (©). 
Так как χη (©) = х,(Т”®), то любое утверждение относительно 
случайных величин х„ может быть сформулировано как утвер- 


1) В конце книги помещен указатель примеров. 

2) Эти характеристики Ὁ и $ можно взять в качестве определений. 
Из общей теории произведений мер нам нужна теорема существования 
на & единственной вероятностной меры P, удовлетворяющей усло- 
вию (1.1). Это утверждение следует также из теоремы существования 
Sa ees (или Даниеля — Колмогорова). Элементарное доказательство 
см. в $ 3. 
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ждение относительно Ху и Т. Если множество A— цилиндр, 
то очевидно, что Т'А— также цилиндр и, следовательно, 
принадлежит οἵ, причем P(T'A)=P(A). Тогда Т - измери-_ 
мое сохраняющее меру преобразование, что вытекает из сле- 
дующего общего результата. 


Теорема 1.1. Пусть «Я ,-— поле, порождающее οἵ. 
Если T'AGEY и Р(Т'А)=Р(А) для всех А из Fy TO 
Т — сохраняющее меру преобразование. 


Доказательство. Совокупность & множеств A из οἵ, 


ον —| 
для которых Т 'АЕ‹Я и Р(Т'А)=Р(А), является моно- 
тонным классом и содержит поле οἵ ϱ, а следовательно, 
совпадает с οἵ (см. Халмош [2]). 


Пример 1.1 дает математическую модель бесконечной 
в обе стороны последовательности испытаний Бернулли. 
Представьте себе простой эксперимент с конечным простран- 
ством состояний ϱ и вероятностью р; исхода i. Пример. 
является моделью мысленного эксперимента, состоящего 
в том, что производятся независимые повторения простого 
эксперимента, образующие бесконечную в обе стороны после- 
довательность. Пусть каждый день производится один 
простой эксперимент. Точка ®=(..., @1, @, Ωι,...) про- 
странства {2 полностью определяет исход большого экспе- 
римента, а ее компонента ®,„ — исход простого эксперимента, 
произведенного в п-й день. 

Здесь может возникнуть некоторая путаница. Мы не 
предполагаем, что знание исхода эксперимента, скажем, 
5-го дня помогает предсказать исход эксперимента 6-го дня. 
Но исход x;(@) не определен, пока не определен исход 
большого ‘эксперимента ®, а с определением @ -полностью 
определен и хз (®). Создается впечатление, что случайность 
` исчезает. Иными словами, все координаты точки ® опре- 
деляются, так сказать, одновременно. Как же тогда они 
‘могут служить моделью экспериментов, совершаемых после-. 
довательно во времени?. 

_ При взгляде на эту модель полезна следующая аллего- 
pun. Tuxe') выбирает точку ὦ из пространства © в соответ- 
ствии с распределением вероятностей Р. Она совершает это 
до начала отсчета времени и затем раскрывает эксперимен- 
‘татору одну за другой координаты ©, — по одной каждый 


` 


1) Богиня случая; см. Грейвс [1]. Ее появление в этой книге каждый 
раз указывает на эвристический оттенок рассуждений. 
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день. Динамические аспекты модели удобно изучать с по- 
мощью преобразования Т, так как оно связано с ходом 
времени. (Сама математика, к счастью, не нуждается 
в подобных интерпретациях.) 


Замечание об обратимости. Применение тео- 


ремы 1.1 к обратному точечному отображению Γ᾽! показы- 
вает, что преобразование примера 1.1 обратимо. В некото- 
рых случаях обратное точечное отображение вполне опре- 
делено (т. е. прямое преобразование взаимно однозначно 
и имеет областью значений все пространство Q), но не обя- 
зательно измеримо. Это имеет место, например, для пре- 
образования Т, определенного на вероятностном простран- 
стве (О, с’, Р’), где Ги О таковы, как в примере 1.1, 
of есть о-поле, порожденное ху, хи, Х.,..., а Р’-— сужение Ρ 
на οἵ '. Измеримость {2 требует некоторого обоснования. 
Однако если это установлено, то из сохранения меры пре- 
образованием Т следует непосредственно сохранение меры 


преобразованием ТГ". 


- Пример 1.2. Пусть Q и οἵ те же, что в первом 
примере, но пусть теперь Р — любая мера, которая 
сохраняется при определенном выше преобразовании Т. 
Сказать, что преобразование Т сохраняет меру Р, равно- 
сильно (в силу теоремы 1.1) утверждению независимости 


P {o: (х„ (©), ..., хиль (©) ) Е E} от п, что как раз совпадает 
с определением стационарности стохастического процесса 
{..., 1, Χο, х,...Ъ образованного координатными случай- 


НЫМИ величинами. Преобразование Т называется а 
связанным с этим процессом. 

Так как совокупность конечных ба ивений непересекаю- 
щихся тонких цилиндров образует поле, порождающее «Я, 
то мера Р на οἵ однозначно определяется своими значениями 


Ρε (ἐν, ...›) ip) -- Ρ {ω: Χα (0) = i, wey Ли (0) = ig} (1.2) 


на этих цилиндрах. Если функции р» на последовательностях 
длины К элементов из о определяются формулой (1.2), то. 


Pri ...) ip) = 0, 
Σ Deas es Na PEPE ly tes (1.3) 


2: ρι()--1, 
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и так как преобразование Т сохраняет меру, то 


Peli» ++» №) = 2s Pasi (6 ἐν ..., ἐπ. (1.4) 


Обратно, существует ровно одна вероятностная мера P Hac , 
соответствующая данному множеству функций р», удовле- 
творяющих соотношениям (1.3) и (1.4), для которой выпол- 
няется (1.2) и которая сохраняется при преобразовании TJ’). 
Если рь(1, ..., #) = Рирь, «++ Ра, Где р; — неотрицательные 
числа, в сумме дающие 1, то имеют место соотношения (1.3) 
и (1.4). Мы снова приходим к примеру 1.1, который будем 
называть сдвигом Бернулли °). В § 3 детально разбираются 
другие специальные случаи. Заметим, что преобразование Т 
как точечное преобразование, определенное на простран- 
стве 9, —одно и то же в примерах 1.1 и 1.2. Однако пре- 
образование, сохраняющее меру, является точечным пре- 
образованием с о-полем, относительно которого оно измеримо 
и сохраняет меру. 

Пример 1.2 дает модель испытаний, не обязательно не- 
зависимых, которые производятся в постоянных условиях, — 
идея, стоящая за стационарностью, т. е. за требованием 
сохранения меры Р преобразованием Т. Так как стационар- 
ные процессы имеют широкое распространение, а любое 
свойство такого процесса является по существу свойством 
соответствующего сдвига, то имеет смысл изучать сам сдвиг. 
Наилучшим способом изучения сдвига является изучение 
сохраняющих меру преобразований, ибо это предоставит 
в наше распоряжение множество примеров, большая часть 
которых значительно проще двух вышеприведенных. Разберем 
здесь еще четыре примера. 


Пример 1.3. Пусть @— пространство из пяти точек. 
{а, b, с, 4, e}, «Я — множество всех подмножеств из Q и 
Т — подстановка, равная произведению двух циклов: 
Т = (а, 6, с) (а, ο). Если Т сохраняет P, то точки в пределах 

циклов должны быть равновероятны относительно Р. 


Пример 1.4. Для Qu «Я из предыдущего примера возь- 
мем в качестве Т циклическую подстановку Τ᾽ = (а, 6, с, а, ὁ). 
Все пять точек должны быть равновероятны. 


Ὁ) Это частный случай теоремы существования Колмогорова: дока- 
зательство дано в $ 3. 

2) В отечественной литературе принят термин автоморфизм Бер- 
нулли. — Прим. ред. 
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Пример 1.5. Пусть © — единичная окружность Ha KOM- 
плексной плоскости, а cf состоит из обычных борелевских 
нодмножеств окружности © (Я есть о-поле, порожденное 
дугами окружности), и пусть Р—мера Лебега на окружности, 
нормированная таким образом, что Р (9) =1. Пусть То = со, 
где с-— фиксированный элемент пространства ©. Так как 
Т есть просто поворот окружности на угол, равный argc, 
то Т сохраняет Р. Далее мы увидим, что свойства преобра- 
зования Т существенно зависят от того, является ли с 
корнем из единицы. 


Пример 1.6. Пусть οἵ состоит из борелевских под- 
множеств полуоткрытого единичного интервала © = [0, 1), 
Р— мера Лебега и То =2о (то@а1) (τ. е. То. равняется 2% 
на [0, 1/2) и 2m@—1 на [1/2, 1)). Преобразование Т тесно 
связано с диадическим (по основанию 2) разложением точек 
единичного интервала; действительно, если [(6)=0 для 


@<1/2 и (в) = 1 для o> 1/9, то f(T") является A-M знаком 


οο 
диадического разложения @= >) f(T" '@)/2” (если ®«— двоично- 
n=1 


рациональное число, TO разложение конечно). Следова- 
‚ тельно, если разложение ὦ имеет вид ®=0, ®1®...., TO 
То = 0, ооо. .... Применение теоремы 1.1 показывает, что 
преобразование Τ сохраняет меру. В то время как все 
предыдущие преобразования были обратимы, это преобра- 
зование, которое мы будем называть диадическим преобра- 
зованием, необратимо. 


Мы привели достаточно примеров преобразований, кото- 
рые помогут иллюстрировать наши дальнейшие рассмотре- 
ния. Некоторое количество дополнительных примеров при- 
водится в $ 3. δ 


Эргодичность 


Нас будет интересовать вопрос: какие преобразования Т 
обладают тем свойством, что для почти всех ® траектория 
{o, То, Г%,...}!) точки ® точно воспроизводит само про- 
странство ©? В примере 1.4 каждая траектория воспроиз- 
водит © в том простом смысле, что она как множество 


1) Мы считаем эту последовательность траекторией точки @, 
даже если преобразование Т обратимо (хотя правильнее было бы 
называть ее полутраекторией, a траекторией — последовательность 


№: То, 1} 
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совпадает с 9, но это неверно для примера 1.3, где мно- 
жество A={a, 6, с} переводится преобразованием Т в себя, 


так же как и дополнительное множество {d, е}: Т'А=А. 
Заметим, что. в примере 1.4 каждая траектория не только 
совпадает как множество с Q, но и содержит элементы из Q 
в правильной пропорции: асимптотическая относительная 
частота, с которой элемент а (или 6,...) встречается 
в траектории, в точности равна Р (а)=1/5 (или Р (5) =155, ...). 

Замечательно следующее: если для некоторого сохраняю- 
щего меру преобразования Г не существует αμ Α 


таких, что T A=A, за исключением „неинтересных“ мно- 
жеств А = д и А =, то траектории воспроизводят простран- 
ство О в том смысле, что для каждого множества A 
траектории почти всех точек ® попадают в A с асимптоти- 
ческой относительной частотой ΓΝ 


αι ty 1,(T*o) = P(A) π. Β. ἢ. 


Ὅρα 


Это центральный факт в эргодической теории. Он будет 
описан и проиллюстрирован в этом параграфе, а доказан 
в следующем. 

Назовем множество о А инвариантным (относительно пре- 


образования Т), если Τ᾽ 'А=А; в случае когда Т обратимо, 
это требование эквивалентно требованию ТА = А. Назовем 
преобразование Τ᾽ эргодическим 3), если каждое инвариант- 
ное относительно него множество тривиально, т. е. имеет 
меру 0 или 1. Следовательно, преобразование примера 1.4 
эргодично, а преобразование примера 1.3 не эргодично 
(если только вся масса не сосредоточена в одном из циклов). 
Мы убедимся далее, что если преобразование Т эргодично, 
то траектории обладают только что описанным свойством. 

По техническим соображениям удобно несколько видо- 
изменить определение инвариантности: назовем множе- 
‘ство A инвариантным относительно преобразования Т, если 


1). / д- характеристическая функция множества А; таким образом, 
п-| 
- ἃ T Ae kw) есть число элементов последовательности {®, Τω,.... To}, 
k=0 
лежащих в А. Символ „п. в." (почти всюду) означает „с точностью до 
множества меры 0“. 

2) Относительно любого множества всюду, где не оговорено про- 
тивное, предполагается, что оно принадлежит полю 

3) Эргодическое преобразование называют также метрически транзи- 
тивным или неразложимым. | 
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P(A+T'A)=0'). Например, если точки d ие в примере 1.3 
имеют нулевую массу, то множество А = а, 6, с, а} инва- 
риантно в новом смысле, в то время как в старом смысле 
оно не инвариантно. Однако для любого множества А мно- 


жество В =Нт ΤΑ инвариантно в старом смысле, и в слу- 
п 


чае когда A инвариантно в новом смысле, множества Аи В 
имеют одинаковую меру. Поэтому, если существует нетри- 
виальное множество, инвариантное в новом смысле, то 
существует и нетривиальное множество, инвариантное в ста- 
ром смысле, так что определение эргодичности не меняется. 
Множество, инвариантное в старом смысле, мы будем назы- 
вать строго инвариантным. Для доказательства эргодичности 
достаточно убедиться, что строго инвариантные множества 
имеют меру 0 или 1. | | 


Замечание. Так как преобразование Т сохраняет 
меру, то : 


Р(А-АПТ'А)=Р(А)-Р(АПТ"А)= 
=P(T'A)—P(ANT A) =P(TA—ANTAA) 
и, следовательно, 
Р(А+Т'А) =2Р(А-Т"'А) =2P(T'A—A). 


Поэтому множество A инвариантно в TOM и только TOM 


случае, если одна из мер Р(А-Т 'А) или ГАА) 
равна 0. В частности, если Т эргодично, то ни одно из 


соотношений Ας TA, T'ACA не может выполняться для 
нетривиального A: не будучи в состоянии оставить нетри- 
виальное множество фиксированным, эргодическое преобра- 
зование не может ни „расширить“, ни „сузить“ его. 
Очевидно, что если преобразование Т обратимо, то оно 
эргодично ВН и только тогда, когда эргодично преобра- 


зование т. 


Эргодичность вращений 


Если в примере 1.5 число с, определяющее поворот, 
равно —1, то множество, состоящее из первого и третьего 
квадрантов, является нетривиальным инвариантным множе- 
ством, и, следовательно, преобразование Т неэргодично. 


1) Знак + означает здесь симметрическую разность: А+В = 
= (А-В) 0 (В-А4). Мы ‚будем часто пользоваться. соотношениями 
А+В< (А+С) + (С+В) и Р(А+В) ЗР(А+С)-Р (С-В). 


2 Зак. 1491 
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Аналогичное построение показывает, что Т неэргодично, 
если с — любой корень из единицы. 

Покажем, что если с не является корнем из единицы, 
преобразование Τ᾽ эргодично. Пусть e, (6) =o” — круговые 
функции; ряд Фурье для характеристической функции Гл 


есть 1,(@)~ >) ane, (в). Так как е„ (То) = с"е, (6), то с по- 


мощью замены переменной, получаем *) 


а == | е.аР=С" |-6.ΩΡ, 
А а 
откуда I ,-1, (ὦ) ~ У c"ane,(@). Если А- инвариантное мно- 
п 


жество, то Г, (ὦ) и J,-1,(@) почти всюду равны и, следова- 
тельно, имеют одинаковые коэффициенты Фурье: а, = с"а, 
для всех п. Если с не является корнем из единицы, то 
а, =0 для всех п=Е0, и в силу теоремы единственности 
для коэффициентов Фурье [,(%) равно почти всюду неко- 
торой константе, так что мера P(A) должна быть равна 
либо нулю, либо единице. Следовательно, преобразова- 
ние Г эргодично. 

Старый теоретико-числовой результат, принадлежащий 
Якоби, состоит в том, что если с не является корнем из 
единицы, то траектория каждой точки ® всюду плотна на 
единичной окружности Q, что представляет собой еще одно 
простое условие эргодичности. (Заметим, что в данном слу- 
чае траектория не совпадает как множество с простран- 
ством Q, ибо является счетным множеством, в TO время 
как Q несчетно.) Для доказательства результата Якоби, 
очевидно, достаточно показать, что траектория {1, с, c?,...} 
точки | всюду плотна. Но если с—не корень из единицы, 
то все точки этой траектории различны и, следовательно, 


2 Функция f (a) интегрируема на А в том и только том случае, если 

функция / (To) интегрируема на 7~'A, причем тогда | f (To) P (do)= 
A 

= | Γ(ω) Ρ (dw). При доказательстве достаточно рассмотреть случай 


A 
A=Q, общий случай получится при замене } на J ale Если { — характе- 


ристическая функция, то | f (To) P (do) = | f(@)P (do), так как T— 


сохраняющее меру преобразование; эта формула легко получается для 
простой функции, а затем, с помощью . аппроксимации, для любой 
функции ᾖ. 
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в силу компактности имеют предельную точку Ὡρ. Поэтому 


для любого положительного = существуют различные точки 


спи c™*, отстоящие от ® He больше чем на e/2 (расстоя- 


ние измеряется по дуге) и, следовательно, не больше чем 


на = друг от друга. Так как расстояние от точки с”* до 


точки ΟΠΠ); равно расстоянию от с” до ο΄"; то очевидно, 


что для некоторого m точки с”, с”**,..., οὗ образуют 


такую цепь вдоль всей окружности, что расстояние между 
любыми соседними точками меньше в. Таким образом, 
любая точка окружности имеет в своей =-окрестности точку 
траектории {1, с, с*,...}, и траектория всюду плотна в силу 
произвольности выбора 6. 

Используем результат Якоби для того, чтобы дать BTO- 
рое доказательство эргодичности вращения Т (по-прежнему 
предполагая, что с не является корнем из единицы). Это 
доказательство не использует теорему единственности для 
коэффициентов Фурье. Пусть Ар-— строго инвариантное 
множество положительной меры, P(A) > 0. Докажем, Ἱ что 
P(A)=1. 

Сначала покажем, что для любого 8 из единичного 
интервала (0<=< 1) существует невырожденная дуга | 
длины, не превышающей а, такая, что Р(АП Г) > (1—=)Р (1). 
Действительно, по определению меры Лебега на окруж- 
ности множество А может быть покрыто последовательно- 


стью дуг Л, [5,... так, что Р(А)|(1 -9>Р(1,) (мы 


предположили, что Р (А) > 0); в качестве членов этой после- 
довательности можно выбрать непересекающиеся дуги длины 


меньшей, чем εἶ). Так как УР (АПГ,)=Р (4)>(1-—е) SP (Jn), 


TO для некоторого значения ий должно выполняться нера- 
венство Р(АП/,) > {1 -- 9) Ρ (1,). Возьмем / = /(.. 

Далее, так как множество А инвариантно, а преобра- 
зование Г обратимо и сохраняет меру Р, получаем 
Р (АПТ"/) > (1-—®)Р (Т"Г). Если п,..., п» - натуральные 
числа, для которых множества Т"/,..., T°*l не пересе- 
каются, то 


k ke 
Р(А)> SP (ANT) > (1 -9Р[ гм. 
i=] i=] 
Если траектория {1, с, с?,...} всюду плотна, то траектория 


любой из концевых точек дуги / также всюду плотна. Так 
НИЕ, 


') Если А содержит интервал, то этого сделать нельзя, но тогда 
- доказываемое утверждение очевидно. — Прим. ред. 


2% 
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как Р (J)<e, то существуют, очевидно, такие натуральные 
числа fy; ;.., Mp, что множества Τ'Ί],....,, T°, πο пере- 
секаясь, примыкают друг к другу так тесно, что покры- 
вают всю окружность, кроме, быть может, множества меры 


ορ, те. р (Чт) > 1—2. Итак, 


Р (А) > (1 — =) (1 -- 2ε), 


а так как в произвольно, TO P(A)=1. Эргодичность Г 


доказана. 
Строго инвариантные множества являются объединениями. 


полных траекторий (множеств вида р Рю То. ΤΗ; 
что вызывает иллюзию возможности построения нетривиаль- 
ного инвариантного множества из „половин“ полных траек- 
торий. Такое построение возможно, когда с — корень из еди- 
ницы, но неприменимо в противном случае: мы видели, что 
если с не является корнем из единицы, то любое строго 
инвариантное борелевское множество имеет меру 0 или 1, 
а тогда это верно и для любого строго инвариантного 
лебеговского множества '). 


Эргодичность диадического преобразования 


Рассмотрим преобразование То = 20 (mod 1) (пример 1.6). 
Если ® =0, в... и’ =©- 1) (то@ 1), то ©’ = 0, w/@,0, ..., 


где ω!--ἷ--ωι. Если A= ТА: TO Фе А. эквивалентно 
Го = Аио’еА эквивалентно Го’е A. Так как То = То’ = 
=0, 0.03. 2 ТОФ А втом и только том случае, если ®’ ΕΞ A. 
Следовательно, если Е = [0, 1/,), то ΑΠ Ε΄) представляет 
собой сдвинутое на 1/› вправо множество ΑΠΕ. Тогда эти 
два множества имеют одинаковую меру (здесь Р— мера 
Лебега) и Р(А) =2Р (АПЕ) =Р(АПЕ)/Р (Е). Таким образом, 
А и Е независимы. Можно показать, что это верно и в слу- 
чае когда Е — любой диадический интервал или объединение 


1) В случае когда с Πέ является корнем из единицы, существуют 
строго инвариантные неизмеримые множества; такие множества авто- 
матически имеют внутреннюю меру 0 и внешнюю меру 1. Упорядочим 
по включению семейство строго инвариантных множеств, не содержащих 
пары точек @, и Wo, эквивалентных в том смысле, что ®;/®› — корень 
из единицы. В силу леммы Цорна это семейство содержит максималь- 
ный элемент A. Любая точка ὦ эквивалентна некоторой точке множества A, 
так как иначе А можно было бы расширить, присоединив к нему полную 
траекторию @. Из сказанного следует, что А неизмеримо. 

2) δ΄ обозначает дополнение множества Ε. 
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непересекающихся диадических интервалов. Для заданного 
положительного 8 выбираем объединение Е так, чтобы 
Р (А+Е) < в. Тогда |Р(А)-Р (Е) |<ви|Р(А)-Р(А)Р(Е)|= 
=|Р (А) -Р(АПЕ)|<е, так что | P(A) = P?(A)|<2e. В силу 
произвольности = имеем P(A) = P?(A), откуда P(A) равняется 
либо 0, либо 1. Следовательно, преобразование Т эргодично. 


Перемешивание | 

Преобразование примера 1.1 оказывается эргодическим, 
но мы покажем, что оно обладает даже более сильным 
свойством. Сохраняющее меру преобразование Т называется 
перемешивающим, если равенство. 


lim Р(АПТ”В)=Р(А)Р(В) (1.5) 


п> oo 
справедливо для любой пары множеств АиВ'). Если T обра- 


тимо, то эквивалентным условием перемешивания является 
условие (1.5), в котором Т "В-заменено на Т”В. Так как (1.5) 


эквивалентно условию Р(Т"В|А)—Р(Т"В)->0, то свойство 
перемешивания имеет смысл и без предположения инва-. 
риантности меры. 

Если множество В из (1.5) инвариантно, то Р(АПВ) = 
=Р(А)Р(В), и если взять А = В, то Р(В) равняется 0 или 1. 
Следовательно, перемешивание влечет эргодичность. В. боль- 
шом числе случаев свойство перемешивания МОЖНО ВЫЯВИТЬ 
с помощью следующего результата. 


Теорема 1.2. Пусть «Я ,-—поле, порождающее οἵ. 
Если (1.5) выполняется для любых А и В из & ο, то npe- 
образование Т перемешивающее. 


Доказательство. Для данных множеств Ди В μ8 οἵ 
и некоторого положительного 8 выберем множества Αρ и By 
ИЗ ef) так, чтобы мера множеств A+A), В+ Ву была 
меньше в. Тогда Т"В+Т"В, =Т"(В+ Во) имеет меру 
‘меньше 8 и, следовательно, мера множества (А a ἘΠῚ + 
+ (AN ΓΒ) меньше 2e для всех п. Таким образом, 


1) Это свойство иногда называют ‘сильным перемешиванием, чтобы 
отличить его от свойства слабого пе: для которого требуется 


=] 
только выполнение условия п” 'Σ |P (АПТ *В)-Р (A) P(B)|—>0, Ον. 
k=0 
ий [3]. 
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Р(АПТ”В) отличается от P(Ayn T"B,) He больше, чем 
на 2ё, и, следовательно, ее верхний и нижний пределы 


не больше, чем на 9 отличаются от НтР (4, ῃ Ι΄" Βῃ) = 
п > oo 


= Р (А ПВо), что в свою очередь не больше, чем на 98 
отличается от Р (АПВ). Результат следует из произвольности 
выбора 8. | 


Если множества A и В -— цилиндры из примера 1.1, то A 
иТ "В-— цилиндры, зависящие от непересекающихся множеств 


координат, если и достаточно велико. Тогда Р(АПТ"В) = 
= P(A)P(B) для «больших п, так что (1.5) выполняется для 
всех множеств A и В из поля цилиндров οἵ ϱ. В силу тео- 
ремы 1.2 Т-— перемешивающее и, следовательно, эргоди- 
ческое преобразование. 

Преобразование примера 1.3, разумеется, не обладает 
свойством перемешивания, ибо оно не эргодично. Преобра- 
зование примера 1.4 эргодическое, но не перемешивающее 
(возьмем ДА=В = {а}). Более интересный пример эргодиче- 
ского, но не перемешивающего преобразования дает враще- 
ние (пример 1.5) при с, не равном корню из единицы. Пусть 
А=В-— верхняя полуокружность; так как траектория {ο} 
всюду плотна, множества А и ΤΑ почти совпадают для 
бесконечно большого числа значений и, так что условие (1.5) 
не выполняется. Таким образом, перемешивание по сравне- 
нию с эргодичностью — свойство более сильное. 

С помощью теоремы 1.2 можно убедиться, что диадиче- 
ское преобразование (пример 1.6) не только эргодично, но 
и обладает свойством перемешивания. 


Формулировка эргодической теоремы 


Займемся теперь основными следствиями из эргодич- 
ности. Функция σ(ω) (которая предполагается измеримой 
относительно of ) называется инвариантной, если g(To)=g (©) 
почти всюду. Множество инвариантно в том и только том 
случае, если инвариантна его характеристическая функция. 
Если g — инвариантная нетривиальная (т. е. не равная почти 
всюду константе) функция, то для некоторого α мера инва- 
риантного множества (ὦ: g (®) < α} заключена строго между 0 
и |. Таким образом, преобразование Т эргодично в том 
и только том случае, если всякая инвариантная функция 
равна константе почти всюду. Мы можем теперь сформу- 


лировать эргодическую теорему. 
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Теорема 1.3. Если f интегрируема, To существует такая 
интегрируемая инвариантная функция f, что E{f}=E {f}}) и 


lim > Vj (r%e) =f (0) п. в. (1.6) 
n-> о 0 


Если преобразование Т эргодично, то | (в) =Е {ἢ п. в. 


Мы дадим сейчас доказательство менее сильного утвер- 
ждения для весьма специального случая: мы покажем, что 
если Т — перемешивающее преобразование И { — характери- 

n—-l 


; 1 р 
стическая функция множества А, то — Ут *@) сходится 
k=0 
по вероятности к E{f}=P(A). Если 


Ci, x = E {(f (T’o) — Ρ (A)) (f (T*@) — P(A) )} = : 
= P(T'A(\T"A)— P(A) P(A), 


то, так как Т сохраняет меру, с; ,=P),;),THe о, =P(ANT"A)— 
--Ρ(Α) Ρ (Α) -» 0 при п-> © в силу предположения о переме- 
шивающем свойстве преобразования Т. По теореме об ариф- 
метических средних сходящейся последовательности имеем 


, п-1 2 n—-1 n—1 
EI] Site) —P a] |- 55 Ус. ь= 
| k=0 i=0 k=0 


п-1 п-1 
1 2 1 2 5 
= pt Yi ύι- Ά)ρεςί--|ρο|155 Ml onl. 
k=1 k=] 


n—-| 

1 у 
Сходимость по вероятности — Σάο) к P(A) следует 

k=0 
теперь из неравенства Чебышева. Доказательство для общего 
случая, непохожее на приведенное, дано в следующем 
параграфе. 


Если предел (1.6) существует почти всюду, то, очевидно, 
предельная функция ] (9) инвариантна и в случае эргодич- 
ности преобразования равна константе почти всюду. Так 
как Е {!}=Е{}}, эта константа есть Eff}. Если Т эргодично, 
то ®-множество, для которого существует предел (1.6), будучи 
инвариантным, имеет меру 0 или 1, но доказательство того, 
что мера его равна 1, затруднительно даже в этом случае. 


1) Символы Ε{Β. | f (a) P (dw) и | f dP взаймозаменяемы. 
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Если 7 неэргодично, то предельная функция | не обяза- 
тельно постоянна, так как если | — нетривиальная инвариант- 
ная функция (скажем, характеристическая функция нетри- 
виального инвариантного множества), то средние арифме- 
тические в соотношении (1. 6) равны самой [, так что {=} 
не равна константе. 

В $ 10 (пример 10.2) мы покажем, что } является значе- 
нием условного математического ожидания (а именно зна- 
чением условного математического ожидания функции fF 
относительно о-поля инвариантных множеств). 


Следствия из эргодической теоремы 


Если преобразование Т эргодично, то, положив в соот- 
‚ношении Os 6) f=J,, имеем 


п—1| 
; | 
jim 5 Σ 1,(T*o) =P (A) п. в. (1.7) 


Ἂμ. 


Именно в этом смысле траектории эргодического преобра- 
зования воспроизводят пространство Q. 

‚ Применение эргодической теоремы к сдвигу Бернулли 
(пример 1.1) приводит к усиленному закону больших чисел 
для испытаний Бернулли. Действительно, пусть [(®) прини-. 
мает значения | или 0 в зависимости от того, является χι (®) 
элементом i множества о или нет {- характеристическая 

| и 


функция цилиндра {ω: х, (в) =й). Тогда У Е (Т*®) указывает, 
во 


сколько раз встречается элемент i среди х, (©), ..., х„ (0), 
| п-1| 


так что предел (если он существует) выражения = УТ о) 
k=0 
представляет собой асимптотическую относительную частоту, 
с которой исход i встречается в той части бесконечной 
последовательности испытаний ©, которая ‘соответствует 
положительным точкам временной оси. Согласно эргоди- 
ческой теореме, этот предел существует и равен Е {f}=p; 
почти всюду, т. е. имеет место усиленный закон боль- 
ших чисел. | 
Придавая f(@) значения 1 или 0 в зависимости от того, 
выполняются или нет равенства X,(@)=i, Χο(ω) =], видим, 
что асимптотическая относительная частота исходов [и | 
в последовательных испытаниях равна р;р, почти всюду. 


Заметим, что эргодическая теорема для сдвига Бернулли 
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сильнее, чем подобные утверждения, так как в качестве [ 
может быть взята некоторая сложная функция всех коор- 
динатных переменных. ss | 

Из применения эргодической теоремы к диадическому 
преобразованию (пример 1.6) следует теорема Бореля о нор- 
мальных числах. Число ® в единичном интервале нормально 
(по основанию 2), если относительная частота единиц среди 
первых Π знаков диадического разложения ® сходится к 1/2. 
Из эргодической теоремы _с f(o)=0 для o< 1/2 и | (9) =1 
для ® > 1/2 следует, что почти все числа нормальны. 

Если же к этому примеру применить эргодическую тео- 

γὲ--} 

рему с [(ω)--ω, то мы увидим, что n δ) {2"o} > 1/2 почти 


всюду (символ’{х} означает дробную часть действительного 
числа Χ). | 

Рассмотрим теперь вращение окружности, когда с не 
является корнем из единицы. В этом случае преобразова- 
ние 7 эргодично, и в силу эргодической теоремы для почти 
всех ὦ траектория {ω, со, ο΄ῶ, ...} точки ® попадает в любую 
заданную дугу / с „правильной“ асимптотической относи- 
тельной частотой, а именно с частотой Р (/). Пусть [, [ο,...-- 
все дуги, концевые точки которых принадлежат некоторому 
фиксированному счетному всюду плотному подмножеству 
из ©, скажем, множеству всех корней из единицы. Тогда 
для почти всех ὦ траектория ὦ попадает в каждую дугу [ῃ 
с соответствующей частотой; нетрудно показать, что траекто- 
рия любой такой точки ® равномерно распределена в том 
смысле, что она попадает во всякую дугу окружности с пра- 
вильной асимптотической относительной частотой !). Таким 
образом, траектории почти всех точек равномерно распре- 
делены, а так как каждая траектория получается из другой 
поворотом, то каждая траектория равномерно распределена. 
Разумеется, равномерно распределенная траектория всюду 
плотна, что снова приводит нас к теореме Якоби. 

Каждое из этих следствий эргодической теоремы (за 
исключением, конечно, основного результата (1.7)) было 
доказано с помощью специальных методов раньше, чем была 
обнаружена сама эргодическая теорема. 


') Можно даже показать (используя теорию слабой сходимости), что 
равномерно распределенная траектория попадает в произвольное боре- 
левское множество А с предельной относительной частотой Р (А), если 
его граница имеет меру 0. Однако для каждого ® существует некоторое 
множество, в которое траектория попадает с неправильной частотой, 
например сама траектория точки ©. 
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Критерии эргодичности 


Рассматривая свойства эргодичности и перемешивания 
преобразований из различных примеров, мы избегали обсу- 
ждения с этой точки зрения общего сдвига примера 1.2. 
Дело в том, что не существует эффективного критерия для 
решения вопроса о том, является ли данный сдвиг эргоди- 
ческим или перемешивающим; вопрос этот должен решаться 
отдельно для каждого такого: случая или класса случаев. 

Приведем построение, показывающее, что сдвиг при- 


мера 1.2 является весьма общим. Пусть Т-— обратимое 
сохраняющее меру преобразование, определенное на вероят- 
ностном пространстве (©, «Я , Ρ), и А- некоторое множество, 
принадлежащее полю οἵ. Пусть (©, «Я ) — произведение про-. 
странств из примера 1.2 с р = {0, 1}. Определим отображе- 
ние ф пространства © в ® с помощью характеристической 
функции (φ(ῷ)), =/[; (7"6). Если Р=Рф\, то сдвиг Т на 
пространстве © сохраняет меру Р. Таким способом могут 
быть построены сдвиги более или менее произвольной 
сложности. 

Следующая теорема иногда используется для установле- 
ния эргодичности сдвигов и некоторых других преобразова- 
ний (применения даны в $ 3). Если соотношение (1.7) выпол- 
няется, будем говорить, что А- респект!) для Т; таким 
образом, всякое множество А является респектом эргоди- 
ческого преобразования Т. Если В — респект для Т, то 


n—-l 


gu ] : 
Πτα да Гао (Τ᾽) = 14 (0) P (8) п. В. 


для каждого множества A. Интегрируя под знаком предела, 
получаем 
п-1 


lim > >» Ρ(Αῃ Τ᾽ Β) -- Ρ (Α) Ρ (Β). | (1.8) 


n->oo k=0 


Итак, каково бы ни было множество A, (1.8) выполняется, 
если только В является респектом для Г. С другой стороны, 
если (1.8) имеет место для всех Аи В, легко показать, что 
мера любого инвариантного множества равна 0 или [ и, 
следовательно, 7 эргодично. Наконец, если соотношение (1.8) 


1) В оригинале «Τ᾽ respects А». Можно показать, что если А — респект 
для Т, то А не зависит от 0-поля Т-инвариантных' множеств (cM. при- 
мер 10.2). — Прим. ред. 
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выполняется для всех множеств Аи В из поля Fo, поро- 
ждающего οἵ, то оно выполняется и для всех множеств A 
и В из οἵ ; этот результат можно получить с помощью 
рассуждений, аналогичных тем, которые были использованы 
при доказательстве теоремы 1.2. Мы имеем, таким образом, 
следующий критерий. | 


Теорема 1.4. Если Т- эргодическое преобразование, 
то каждое множество А является респектом для Т и соот- 
нощение (1.8) выполняется для всех А и В. Пусть οἵ .»— поле, 
порождающее oF . Если каждое множество А из « у является 
респектом для Т или если соотношение (1.8) выполняется 
для всех Аи Виз F o, το F y— эргодическое преобразование. 


Сопоставление соотношений (1.5) и (1.8) показывает, что 
перемешивание в сравнении с эргодичностью является более 
сильным свойством. 

Даже если apeovesenens T не эргодично, TO 


im У Тв (®) п. в. 


п> co 


Интегрируя. по A, а 


lim 4 >) PLANT? BYE ILL). 


п> co 


Правую часть этого равенства можно записать в другой 
форме, симметричной относительно Ди В. Действительно, 


функция (/,/,) , соответствующая функции [д/в, имеет почти 
всюду значение 


lim — >) 1,(T*o) Тв (T*o) = 


tl -> © 


= lim = >) Гл (Т*®) Τα (0) = 7. (0) Τα (в), 
n-> co 
где первое равенство выполняется почти всюду В. силу инва- 


риантности ἘΞ Поэтому, так как функции Ens И С 
имеют одинаковый интеграл, то 
| п-1 
lim = УР АПТ *В) = Е {141}. (1.9) 


п > oo 


Предел в соотношении (18) всегда существует. 
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Более сложный сдвиг* 1) 


Наша заключительная иллюстрация развивает идею при- 
мера 1.2. 


Пример 1.7. Пусть © состоит из бесконечных в обе 


стороны последовательностей ®«=(..., ΘΙ], ®%, ®,...) дей- 
ствительных чисел; пусть cf есть о-поле, порожденное ци- 
линдрами, т.е. множествами вида {@: (хи (©), ...,Хиль-1 (@)) SE}, 


где Е есть К-мерное борелевское множество (здесь коорди- 
натными переменными являются X, (6) = ®„); и, наконец, пусть 
Р— любая мера, которая сохраняется при сдвиге Т, опре- 
деленном формулой х„(То) = хи. (®). Мера Р определяется 
посредством конечномерных мер 


и» (Е) =Р{о: (x, (©), ..., Хиль (o)) = Е}, 
индуцирующих ее. Сдвиг Т соответствует стохастическому 
процессу {..., Хь Χρ, %1,...} с действительными значе- 


НИЯМИ. : 

Если каждая мера μι является Р-кратным произведе- 
нием μι, то {х„} — процесс с независимыми значениями. Тогда 
в силу теоремы 1.2 преобразование Т обладает свойством 
перемешивания и потому эргодично. Положив в эргодиче- 
ской теореме ] (©) = ху (®), видим, что при ЕЁ {| №, |} < 0 

n—| 


dim Σ»εώ- ЕТ. в. 


п> oc 


Таким образом, эргодическая теорема содержит усиленный 
закон больших чисел для независимых одинаково распре- 
Деленных случайных величин с конечным первым моментом. 

Пример 1.7 обладает такой общностью, что выполнение 
требований эргодической теоремы для каждого преобразо- 
вания такого вида означает выполнение их для любого 
обратимого преобразования. В самом деле, для того чтобы 
доказать эргодическую теорему для данной интегрируемой 


функции 7 и обратимого сохраняющего меру преобразова- 


ния Τ᾽ на вероятностном пространстве (0, ¥, P), возьмем 
(0, ¥), как в примере 1.7, и зададим меру Р на οἵ фор- 


мулой Р = Pq", где ем=@-. ΕΤ ὦ), Γ(ῷ) ; (TS), Beas i 
Тогда функция ху (©) интегрируема на ©. Если А есть @-MHO- 


жество, на котором — Ly хь (©) сходится к [ ХР и A— ΜΗΟ- 
k=0 


1) Звездочкой отмечены те разделы, которые можно опустить. 
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>=] 


жество, на котором Ly} 7 (Т*6) сходится к | Рав, то А = 
k=0 

= oA. Если для сдвига T на пространстве © справедлива 

эргодическая теорема, то Р(А)=1, так что и Р (А) =1. 


(Если преобразование Т необратимо, то аналогичный анализ 
можно провести с пространством односторонних последова- 
тельностей действительных чисел.) 

Аналогичное рассуждение показывает, что из эргодической 
теоремы для сдвига примера 1.2 вытекает, что для любого 
обратимого эргодического преобразования Т каждое мно- 
жество того пространства, на котором это преобразование 
определено, является его респектом. 

Пример 1.7 можно использовать как образец для срав- 


нения иным: образом. Пусть {..., X_1,; ἆρ, ἆι, ...}-- стохасти- 
ческий стационарный процесс, определенный на пространстве 
(О, οἵ, P), τ. ο. Ρ{ᾶ: (K,(@), ..., ἕπεν ι(ῶ)) ЕЁ} не зависит 


от и. Здесь нет необходимости считать ® произведением 
пространств, а х„ — координатными переменными. Определим 
отображение 4 нашего пространства О в пространство © 
примера 1.7 формулой ABO) hos XK (OK Е А 
и пусть P= Pap. Тогда сдвиг Т на пространстве Q coxpa- 
няет меру Р в силу предположения о стационарности про- 
цесса {%,}. Все определения и вопросы, касающиеся {}}, 
могут быть сформулированы в терминах координатных пере- 
менных X, в пространстве Ω и меры Р. Например, процесс {x,,} 
называют эргодическим или перемешивающим в зависимости 
OT того, обладает ли соответствующим свойством сдвиг Т; если 


{Х„} — эргодический в этом смысле процесс и [15 1dP < оо, 
TO, применяя эргодическую теорему к сдвигу Г, получаем, 
ee 


что ТУ, (ὦ) --» | я АР с вероятностью единица. 
k=0 


Замечание. Наше введение в эргодическую теорию 
игнорирует факт происхождения ее из статистической меха- 
ники (см. Кац [1]). 

Общее изложение эргодической теории можно найти 
в работах Халмоша [3], Хопфа [1] и Якобса [1, 2] '). 


') См. также Рохлин [6]. Современное состояние эргодической теории 
отражено в серии статей, опубликованных в УМН, 21, вып. 5 (1967). — 
Прим. ред. 
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2. ДОКАЗАТЕЛЬСТВО ЭРГОДИЧЕСКОЙ ТЕОРЕМЫ 


Эргодическая теорема заслуживает более чем одного 
доказательства. В этом параграфе мы сначала сведем эрго- 
дическую теорему к так называемой максимальной эргоди- 
ческой теореме (теорема 2.4), используя функциональные 
пространства Г! и L*, Затем докажем максимальную эрго- 
дическую теорему безотносительно к [11 и L?, И, наконец, 
дадим еще одно доказательство, опирающееся на макси- 
мальную эргодическую теорему и не использующее прост- 
ранств L! и L?. 


} 


Первое доказательство !) 


Сохраняющее меру преобразование Т на BePOATHOCTHOM 
пространстве (©, «Я, P) естественным образом порождает 


оператор Т в гильбертовом пространстве L? действительно- 
значных, интегрируемых с квадратом функций, определен- 
ных на ©. Пусть } (©) — любая действительная функция на 


пространстве ©. Будем обозначать символом Τῇ функцию, 
которая принимает в точке ὦ значение { (То). Если f изме- 
рима (все рассматриваемые ниже функции будем предпола- 


гать измеримыми), то и функция Τῇ измерима, так как Т 
измеримо; если f принадлежит [., то и Τῇ принадлежит L?, 


ибо преобразование Т сохраняет меру. Итак, оператор Т 
отображает пространство L? на себя; линейность его оче- 
видна. С помощью замены переменной имеем 7) 


(Tf, Tg) = | Тр. Τα аР = | (То) в (То) P (do) = 
= | Ко) (®)Р (49) =(f, 8). 


Скалярные произведения и расстояния сохраняются: Τ᾽ — изо- 
метрический оператор 3). 

Пространство интегрируемых с квадратом функций на 
пространстве пяти точек {a, 6, с, а, е} из примеров 1.3 и 1.4 


1) Можно, минуя первое доказательство эргодической теоремы, сразу 
заняться теоремой 2.4. Но доказательство это поучительно, хотя и ведет 
нас окольным путем. 

2) Символом (|, g) мы обозначаем скалярное произведение, символом 


lf lle=V G, f) — норму в пространстве 12. Σ 
3) Изучение изометрического оператора J, лишь самые простые 


_ свойства которого здесь используются, может дать совсем немного све- 
дений о порождающем его преобразовании 7, сохраняющем меру. Даль- 


нейшая информация относительно Τ᾽ содержится в конце $ 5. 
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можно отождествить с пространством А 5-мерных векторов 
(столбцов). При таком отождествлении изометрические опе- 
раторы Т, порожденные преобразованиями этих примеров, 
задаются матрицами перестановок 


ооо 9005: 
0.0109 090 - 
Е Se ok 8 
он 9091 
0 020550 ох 


соответствующими (а, 6, с) (а, ὁ) и (а, ὑ, с, а, ὁ). Поворот 
_ окружности (пример 1.5) порождает изометрический опе-. 


ратор, переводящий функцию с рядом Фурье D anen (©) 
п 


в функцию с рядом Фурье Dj cape, (Ω). 


Эргодическая теорема утверждает, что если функция ] 
интегрируема, то 
n—| 


+ yf (Te) 1) п. В. 


длЯ соответствующей ‘функции Г. Мы докажем сначала 
менее сильный результат, известный под названием ро: 
ческой теоремы !) в L?, 

Обозначим символом A, оператор усреднения 


Заметим, что. 
ll Ant lb ИП. (2.1) 


Теорема 2.1. Для любой функции | из [2 существует 
инвариантная функция | из L?, такая, что Αρ] >f в смысле 
т. е. || Anf —T lb 9. 


Доказательство. Если A,f вообще сходится к функ- 
ции из [,2, то эта предельная функция, разумеется, инва- 
риантна. Пусть Е? -— система функций } из L?, для которых 
последовательность {A,j/} сходится. Мы покажем, что Ε’ 
замкнуто и содержит подмножество, порождающее L?, 
а следовательно, совпадает с L?, 


1) Для того чтобы отличить саму эргодическую теорему (теорема 1.3) 
от прочих, ее называют иногда индивидуальной эргодической теоремой. 
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Пусть f, = Е? u ll fe—flp—> 0. Тогда и f © Е?. Чтобы дока- 
зать это, достаточно проверить, что средние арифметиче- 
ские АЕ образуют фундаментальную последовательность. 
as 11 —ГЬ<е, то в силу (2.1) 


Ат — Anf le Sil Ant Атрь lb +l Anise Ants lb + 
+I] Ante — Anf lb «| Атрь — Азы + 28. 


Последовательность {A,/f}, действительно, фундаментальна, 
так как || „Ать— А —0 при πι, n—-> oo, Е а 
система Е? замкнута. 


Если f = Tf, το, очевидно, ie E?(f =f). Если f имеет вид 


f=e—Tg, то A,f=(g—T"g)/n, так что || Apf kh < 28 b/n +0 
и |= Е?(=0). Таким eas Е? содержит класс E?, co- 


стоящий из всех инвариантных функций и всех функций 
вида g—Tg. 

Остается. еще показать, что Εὖ порождает [^, τ. е. 
‘единственная ортогональная к Εὖ функция есть 0. Для этого 
достаточно показать, что любая функция A, ортогональная 
всякой функции вида g— Го, удовлетворяет требованию 
h=Th (тогда если она ортогональна и всякой инвариантной 
функции, то она ортогональна самой себе и, следовательно, 
равна 0). Благодаря свойству (Й, ТЬ) = = (Т’ hi fa) сопряженного 
оператора Τ᾽ имеет место тождество (й, в — Тв) =(в-— ГВ, в). 
Поэтому, если (ή, g- Tg)=0. для всех g, то й = T*h. Далее'), 
| ἦν — Th = — (A, Th) — (Th, h) + | Th Ι. Очевидно, что 
[1η|ἑ--[π|Ρ, и если h=T*h, то (в, ТВ) = (Т"В, В) =| ВВ 
аналогично (Th, в) =, так что ||h—Th I; =0, или h=Th. 
Итак, h=Th, если функция fh ортогональна каждой функции 
вида g—Tg, что завершает доказательство. 

Заметим, что оператор, переводящий { в [, является 
ортогональным проектором на подпространство инвариант- 
ных функций. 

Следующий шаг состоит в доказательстве теоремы, ана- 
логичной теореме 2.1, для пространства L!. Так как Р (0) =1, 


то L? является подпространством в L!, Если функция f (o) 
интегрируема, то интегрируема и a { (To) и, следовательно, 


) Если изометрический оператор Г обратим, то он унитарен, так что 
μα h=Th=T"'h следует выполнение требования h = Th. Однако Г может 
быть необратимым, что обосновывает необходимость дальнейших рас- 
суждений. 
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i πρ 


оператор Т определен на пространстве L! _интегрируемых 


функций. Теперь мы будем рассматривать Т как оператор 
в ΙΙ, отображающий подпространство L? в себя. Если || f |=. 


== | | {|АР обозначает норму BL}, то | т! lh =ИА и (мы исполь- 
| n=} 
зуем символ Ay, как ивыше, для обозначения ревет τ - У, jae 


k=0 
но теперь BL’) | Ant lh SIF lh. 


Теорема 2.2. Для любой функции f из L существует 
ωρες функция f из [1, такая, что A,f >f в смысле ГЛ, 
6. l| Anf —F lh 0. 


Доказательство. Обозначим через E! множество 
функций f из L', для которых утверждение теоремы спра- 
ведливо. Те же рассуждения, с помощью которых мы пока- 
зали замкнутость системы Е? в пространстве L*, доказывают 
и замкнутость E! в [1 — нужно только везде заменить нормув i? 
на нормув /.1. Если} принадлежит L?, ΤΟΠΟ ets а теореме 
существует некоторая функция / из L?, такая, что || Αμ —f |h>0, 
и эта функция принадлежит, разумеется, и Li. В силу не- 
равенства Гельдера имеем || A,f —f ||! < | A,f — [|b 0, так что 
fe E', Итак, [< ΕΙ. Любая функция f из [1 является пре- 
дельной в смысле [1 для функций из L? (ограниченных), 
так что замыкание L? в [1 совпадает с самим L!. Так как 
Го Е! и Εἰ замкнуто, то E'=L', . 


Очевидно, что J AgfaP = [ Гар, и так как Απ]-»] 
в смысле L}, т 


| fap =| fap. 49 


Попытаемся ΠΟΟΤΡΟΗ͂ΤΡ доказательство индивидуальной 
эргодической теоремы, следуя линии двух предыдущих дока- 
зательств. Пусть @ — множество элементов } из L!, для кото- 
рых существует функция | такая, что. 


lim L Уго) » п В: 


п> 00 


Если такая функция } вообще ΕΠΕ она должна CO- 
впадать с функцией ] из теоремы 2.2 и, следовательно, 
должна быть инвариантным элементом пространства Ι΄], 
удовлетворяющим соотношению (2.2). Мы докажем индиви- 


-8 Зак. 1491; 
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цуальную эргодическую теорему, показав, что С (а) замкнуто 
в L' и (Ὁ) содержит подмножество, порождающее LI, 
Предположим, что утверждение (а) справедливо, и будем 
доказывать (b). Если {= ТЬ то {+ < ({=|. Если f=g—Tg, 
где σ(ω)-- ограниченная (скажем, константой К) функция, то 


| Anf (в) |= g (@) — g (T"e)|/n <2K/n—> 0 


для каждого ®, так что {+ С ({=0). Если f=g— Го, где 
се/[\, выберем ограниченные функции о, _такие, что 
|2, —2|-0. В силу непрерывности оператора Т функция | 
является предельной в смысле L! для функций g,—T gp, и, 
значит (если выполняется (а) принадлежит С. Следова- 
тельно, @ содержит класс Εὖ, введенный в доказательстве 
теоремы 2.1, состоящий из всех инвариантных элементов L? 
и всех элементов вида g— То, где g принадлежит L*, Было 
показано, что замыкание класса E* BL? есть само L’, В силу 
‚неравенства Гельдера любой PEE в смысле L? эле- 
мент Ес является также предельным в смысле [1; таким 
раем, множество G, по предположению замкнутое в L}, 
содержит L* и потому совпадает с /[.1. 

Остается показать, ‘что G замкнуто в смысле №. Будем 
считать установленным следующий результат. 


Теорема 2.3. Если [= и ^>0, то 
τα sup| Αα] (6) [> А} > ΓΙ: 


|. 


Предположим, что ЕС и 1—0. Для каждого @ 


| Ат (ὦ) #23 ΚΠ] (ω)| < Ame (©) ag Ante (©) | + 
+2sup|Ay(f(o)—fr(o))- (2.3) 


Так как № = С, TO последовательность {A,f,(o)} фундамен- 
тальна почти всюду для каждого №, так что первый член 
в правой части неравенства (2.3) стремится к 0, когда 
т, п-> со. Тогда: в силу теоремы 2.3 


Пт | Ani (o)— Ani (o)|= lim зар |Ακ]ίω)-- АМФ) (2.4) 


т n-> oo >ccm nak 


превышает A с вероятностью, -не большей 2||f — | |1/^. 
Устремляя А-—> < и Л->0, видим, что значение (2.4) поло- 
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жительно с вероятностью 0: последовательность {A,f (o)} 
фундаментальна почти всюду. Итак, A,f(@) имеет почти 
всюду предел, который в силу теоремы 2.2 должен быть. 
инвариантным элементом пространства L!, 

Первое доказательство эргодической теоремы закончено. 
Заметим, что теорема 2.3 играет ту же роль в доказатель- 
стве замкнутости G, что и элементарное неравенство (2.1) 
в доказательствах замкнутости многообразий Е? и Εἰ (тео- 
ремы 2.1 и 2.2). Tak Kak в индивидуальной эргодической 
теореме мы имеем дело со сходимостью почти всюду, то 
мы не можем ‘использовать неравенства, которые сущест- 
венно слабее неравенства теоремы 2.3. Теорема 2.3 следует 
из теоремы 2.4 (заменой } на |f)). 


Максимальная эргодическая теорема 


Итак, все сводится к следующему результату, известному 
под названием максимальной эргодической теоремы. 


Теорема 2.4. Пусть 


-ῃ-] 


1 ΝῚ k Fes 
= Ξ ----- A z : 
N © sup τ ο ῳ) > (2.5) 
Если | интегрируема, то 
_ АР(М < | ΤάΡ.. (2.6) 
м 


Заметим, что можно не требовать положительности A, 


Доказательство. Пусть 
n—-1 : 
<-| Sup Yi (rta)>0}. 

n>1lk=0 


Достаточно показать, что 


| fap 5:9; 
G 


тогда (2.6) получается заменой f на f—A. , 


Если 5 
οι- [в max Di r'e)>0}, 
lxusk i=0 


3* 
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то Е и, следовательно, в РВ теоремы об. 
Gp 


арифметических. средних ту | fdP— | iP. rie до- 
k=l G, 

_ статочно доказать, что 

У 140, б-р. PE 99] 

k=1 Gp | 


При n=1 это неравенство тривиально, оно даже не со- 
держит Т. Поучительно детальное рассмотрение случая n=2. 
В этом случае неравенство (2.7) записывается как 


! [(ω) dP + J [(ω) dP 550, (2.8) 


где G,={f(@)>0} и αυ или Γ(ω) + f (To) > 0). Если 
Οἱ = {f (То) > 0}, то с помощью замены переменной находим 


{Fo ΩΡ = | F(To) dP (мы используем здесь сохранение 
G, α΄ 
меры преобразованием 7), так что неравенство (2.8) экви- 
валентно неравенству 

[Годар + [f(To)dP>0 99) 
и, следовательно, неравенству 


| [F(o) + (To)] ар + J КоаР+ | КТо)аР>0 
GoNG, | Gy-G, | G,-G, 


Неравенство это выполняется, так как каждый из трех со- 
держащихся в нем интегралов неотрицателен; поскольку 
подинтегральная ‘функция в каждом из них положительна 
в области интегрирования. Можно рассуждать несколько 
иным образом, замечая сначала, что (2.9) эквивалентно He- | 
равенству 


| | (ῳ) Го, (a) +i (Τω) ly (ο) dP 5:0, 


а затем, что подинтегральная функция в этом выражении 
неотрицательна для каждого ®. Такое рассуждение при- 
менимо и в случае п>2. 
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Фиксируем п, и пусть H, =T"G,-_,. С помощью замены 
переменной` имеем ты 


> | Кар = Σ | flo)aP = [авар = 


k=1, Gp i= mG sy η и= OSH; 


n—| 


={) Mile); (о) | ἄρ᾽ 
n=0 


(Этот шаг соответствует сделанному выше переходу от G, 
к ΩΩ здесь мы используем предположение о сохранении 


меры преобразованием 7.) Неравенство (2.7) будет доказано ~ 
если мы покажем, что подинтегральное выражение 


Σ [(Τ΄ω)! μ, (ὦ) : (2.10) 


неотрицательно в каждой точке ὦ. Точка ®’ принадлежит 
множеству С, в том и только том случае, если хотя бы 
одна из сумм 


f(a’), f(@’) +f (To’), ..., Ро) +... + КТ) 


положительна; следовательно, Θ΄ принадлежит Си, B TOM и 
только том случае, если хотя бы одна из сумм 


(о), τάμε T (ω') + $2 ES uci @’) 


положительна. Следовательно, oGH,=T Gp, или То ΕΞ. 
=С,_, в том и только TOM А если хотя бы одна. 
из сумм 


f(T“o), (To) +f г), Sra aT oe) (210 


положительна. Таким образом, (2.10)—cymma [(Τ΄ω) πο тем и, 
для которых хотя бы одна из сумм (2.11) положительна. 

Зафиксируем. Ὁ и положим с, =} (To). Доказательство 
максимальной эргодической теоремы завершается следующей 
_комбинаторной леммой. 


Лемма. Назовем член с, конечной последовательности 
чисел Coy Οι, «e+, С, лидером, если хотя бы одна из сумм 


С, Cu -|- Cutt oe 93 Cu + 94 + Cn-1 


положительна. Тогда сумма!) лидеров неотрицательна. 


1) Пустую сумму условимся считать нулем, 
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Доказательство получается индукций по числу п 
элементов последовательности. Для n=1 результат три- 
виален. Предположим, что он справедлив для натуральных 
чисел, меньших п. Если со не лидер, то все лидеры данной 
последовательности являются одновременно лидерами уко- 
роченной последовательности Cj, ..., Си-1 и их сумма неот- 
рицательна` в силу предположения индукции. Пусть теперь’ 
с — лидер. Если А -— наименьшее натуральное число, для 
которого сумма Co+... + сь положительна, TO с1,..., Cy — 
тоже лидеры, ибо если бы один из них, скажем ср не 
являлся лидером, то сумма Εἰ... ΠΟ. не была бы по- 
‚ ложительной и, значит, Co +... +с;.,>0, что противоречит 
выбору К. Итак, сумма лидеров су, Cy, ..., Cy положительна; 
сумма остальных лидеров (если такие существуют) неотри- 
цательна, так как они лидируют в последовательности, 
число членов которой меньше п. Доказательство завершено. 


Второе доказательство 


Эргодическую теорему можно непосредственно вывести 
из максимальной эргодической теоремы. Заметим, что если 
множество А инвариантно, то 


ЛР(АПМ) < | faP (2.12) 

ANN = | 
(где М определено выражением (2.5) и } интегрируема), что 
легко получается заменой f на f:J,. Используя это заме- 


чание, покажем, что с точностью до множества меры 0 
последовательность средних а 


:Ν [(17ω) 


k=0 
сходится (быть может, к +00 или — 0d), 
Положим для αὖ 


Π--] 


Αα. 4 lim τ Ут <а<ь< мгу, j(T*o) 


n> 


Очевидно, что Ay, инвариантно и 
п—1 


а {su SUD = БР Tie) eb 
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Если в (2.12) положить А=ф, имеем 
bP (Aa )< | 14». 
Κα 


Если вместо f, а, 6 взять --], —a, —b, получим 


| [ар <аР(Аь,ь) 


Аа, b 


Таким образом, bP (Ag, ь) < аР(А., ь), что возможно, TOALKO 
если P(Ag,»)=0, поскольку a<b, Если А— объединение A, , 


_ по всем парам рациональных а и 6 (а<5), то Р(А)=0. 
Вне А значения верхнего и нижнего πῶςπεβοβ. последо- 
_ вательности средних совпадают. ее 


tim +S j(r%e) = f(m) п.в., 
k=0 


где [(@) конечно или равно +0o или —oo, С помощью 3a- 
мены переменной получаем © 


n-l 
1 ΝῚ ᾶ 
J =e i lirto)[ap= [1}4Ρ 
k=0 
и, применяя лемму Фату, имеем 
п—1 
+ Уго) ар 
k=0 


Таким образом, функция | интегрируема; в частности, она 
почти всюду имеет конечное значение. 

Так как предельная функция ᾗ инвариантна, остается 
только показать, что интеграл от нее совпадает с интегралом 


< [1Π4Ρ. 


[Пар < "πι m | 


-ᾱξ--- 
от ]. Обозначим а, (в) =-- Ἓ [(Τ/ω). Так, как а, (®)—] (o) 


k=0 
почти всюду и [ а-аР= | ГАаР, то, производя формальные 
действия, получаем 


[14Ρ- | lim a, dP = lim | a,dP = J fa. ou 
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Покажем, что такая перестановка предела и интеграла 
законна '). Если М> 19: sup| ал (@ Dig HF 


Τι 2: ἱ 


[lan—FlaP< [la,—flaP + J tania + ANG: 
м | Nn ee 


При фиксированном положительном A первый член суммы 
в правой части неравенства стремится к O, когда п-> со, 
в силу теоремы о мажорированной сходимости; Поэтому 
достаточно показать, что второй и третий члены суммы 
можно сделать малыми равномерно по и, выбрав боль- 
moe A. Относительно третьего члена это утверждение спра- 
ведливо, потому что в силу максимальной эргодической 
теоремы Р(М№)<Е{|}|}/^—>0, когда п-> со. Что касается 
Второго члена, то мы имеем 


[1α.|4Ρ <- >) [ IF (7*o)|P (do) 


{ [f(T*e)|P(do)< | (ТР (do) + aP (N)), 
{| #(7%@) | > а} 3 
так что с помощью замены переменной получаем 


JlaldP< | |®)Р (во) +аР (№. 
Ny {|f(@)| >} | 


Мы можем сделать правую часть этого неравенства малой, 
выбрав достаточно большие а и ^. 


Итак, “f la,—f|dP—0, что делает законной переста- 


новку предела и интеграла в (2.13)?) и полностью завер- 
шает доказательство эргодической, теоремы. 


Замечание. Эргодическая теорема в L” была впервые 
доказана Нейманом [1], индивидуальная эргодическая тео- 
рема — Биркгофом [1]. Приведенное нами доказательство 
_ максимальной эргодической теоремы принадлежит Риссу [1]. 


1) Это очевидно, если f ограничена. Следовательно, уже можно за- 
ключить, что если Г эргодично, то траектории воспроизводят Q в том 
смысле, в котором речь об этом шла в $ 1. 

2) И, между прочим, еще раз доказывает теорему 2.2. Незначитель- 
ные изменения в рассуждениях приводят ко второму доказательству 
теоремы 2.1. Ἢ 
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_3. ДАЛЬНЕЙШИЕ ПРИМЕРЫ 


В этом параграфе мы собрали несколько примеров, кото- 
рые понадобятся нам позже для иллюстрации различных 
результатов. 


Сдвиги 


Пример 3.1. Рассмотрим’ специальный случай общего 
сдвига ‘(пример 1.2). Пусть И = (р;;) — стохастическая (г Χ r)- 
матрица, строки и столбцы которой соответствуют элементам 
пространства состояний о. Обозначим через р =(р;) такой 
вектор (строку) вероятностей, utc рИ=р. Мы че делаем 
никаких специальных предположений относительно ма- 
трицы П; она может быть или не быть неприводимой, непе- 
риодической ит. д. 3). 

Функции 


ко =: Pi i, + Pi, i, 
удовлетворяют условиям (1.3), первое из'которых очевидно, 
второе следует из стохастичности матрицы II, третье — из 
того, что р— вектор вероятностей. Условие стационарности 
(1.4) также выполняется, поскольку pll=p. Поэтому суще- 
ствует единственная мера P, сохраняющаяся при сдвиге Г, 
такая, что 


Р te) Shy sey Χμερ (O)=8,} SD, Pees Pip ste: 


При. так определенной мере мы будем называть Т сдвигом 
Маркова °). Сдвиг Бернулли является частным случаем сдвига 
Маркова при p;;= p;. Подобным же образом можно определить 


сдвиг Маркова более высокого порядка. 

В силу теоремы 1.2 общий сдвиг Т является перемеши- 
вающим в том и только том случае, если соотношение 
lim P(AN TB) = P(A)P(B) выполняется для всех. цилинд- 


abe Au В. Так как каждый цилиндр представляет собой 
конечное объединение непересекающихся тонких цилиндров, 
то достаточно, чтобы это соотношение выполнялось- ДЛЯ 


1) В терминологии мы следуем Феллеру [1]. 
2) В отечественной литературе принят термин авто мор 
кова. — Прим. ред. 


физм Мар- 


42 : ГЛ. 1. ЭРГОДИЧЕСКАЯ ТЕОРИЯ 


тонких цилиндров A и В: сдвиг Т является перемешивающим 
в том и только том случае, если для всех Ги ] 


hae rete a Χα ἐμ Хы =i» ..»} Хил = =j}= 
Ри, κι-ἰ]Ρρίαι-ῇ[ν...ν χοἰ]. 41) 


Аналогичные рассуждения, опирающиеся на теорему 1.4, по- 
казывают, что сдвиг Т эргодичен втом и только том случае, если 


lim — гри, еъоу Χα Εμ; Хьы = Л, oe ey Хью = jo} = 
n->oo М = 


= Ри, «5549 хи = Ш} P(X, = jp ет Χο = jy}. (3.2) 


Согласно (1.9), предел 
--] 


|. 
lim — EYP. ek SS Le ee i, ss hee ee ee 


n->oo 7 


существует, даже если Т He эргодичен. 

_ Вернемся к сдвигу Маркова. Будем предполагать теперь, 
что р; >0 для всех i, принадлежащих ϱ (любое состояние i 
с р; =0 никогда не может наступить и потому не имеет 
отношения к процессу). Изучим условия, при которых сдвиг 
Маркова эргодичен. 

Полагая в соотношении (3.3) и = и видим, что предел 


всегда существует 1). Если Т эргодичен, то 4;;,=р; в силу 
(3.2). С другой ‘стороны, если p;;=p,;, то сдвиг Τ᾽ эргодичен, 


так как вероятность в соотношении (3.2) равна 


Pi Pity s+ Pi Pea р, πη; Е > и. 


u- 
Докажем эквивалентность следующих - четырех утвер- 
ждений: 


(а) сдвиг Т эргодичен; 
(b) 9:7 не зависит от i; 


1) Здесь pi) означает вероятность перехода из состояния # в состоя- 
ние | за К шагов, причем py} = =6; 


sap Ἔ 
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(<) матрица Ц неприводима Ὁ); 
(9) 9:;; >0 для любой пары i, j. 
Пусть числа 4:; образуют матрицу Qi 


Q=lim ту | 6:9 


п> oo 


Нетрудно показать, что © — стохастическая матрица, для 
которой выполняются соотношения - 


= 

QU =11Q =@, ae Q. | (3.5) 

Так как pll=p, то pll*=p для. всех k, следовательно, 

в силу (3.4) pQ=p. Значит, g;; не зависят OT i в том и 

только том случае, если 4;;,=р,;. Таким образом, устано- 
влена эквивалентность утверждений (a) и (b). 

Предположим, что матрица ПИ не является неприводимой; 

обозначим через оу собственное замкнутое подмножество в р. 

ge 

Пусть А = {o: x)(@) = 0%}, тогда 0< P(A)< lu Ρ[Α--Τ Α) =0.. 

Так как А-— инвариантное множество (см. замечание, сле- 

дующее за определением инвариантности в $ 1), то сдвиг Т 

не эргодичен. Итак, из (а) вытекает (с). 
В силу (3.5) gij= 9 мРи) > Чирь» следовательно, если 


dik > 9 и Pp; > 0, то 93; > 0. Поэтому р; (множество таких |, 
что 4;; > 0) замкнуто. Если матрица Il неприводима, TO р;, 
будучи непустым, должно совпадать с р. Таким образом, 


из (с) вытекает (4). 
Предположим теперь, что все 4;; положительны и 


Σο; -ь, ico. (3.8) 


Пусть максимальное из & равно m. Если & < т для неко- 
. 2, 

торого i, TO En = У 9. ξ, = Уьт=т для всех k, что He- 
i [- 


возможно. Поэтому в силу утверждения (4) (8.6) выпол- 
няется в том и только том случае, если все &; равны 
между собой. Так как О? = 0, то каждый столбец матрицы Q 


1) Множество ро < © замкнуто, если 2% Pij ‚=1 для всех i из βῃ ма- 

Те ро 
трица Il неприводима, если о не содержит ЕЕ замкнутого под- 
множества. Требованием, эквивалентным требованию Вы 


является существование для. Kamion пары i, | такого п, что py) > 0. 
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является решением системы уравнений (3.6); следовательно, 
qij не зависят от i. Итак, (а) влечет (b). 

Мы показали, что наши четыре утверждения эквивалентны 
друг другу и что они эквивалентны требованию единствен- 
ности решения (разумеется, с точностью до множителя) си- 
стемы (3.6). Легко видеть, что (b) выполняется в том и только 
том случае, если система 


Gj = 1p ISO 7 (3.7) 


имеет только одно решение. В силу (3.4) любое решение 
системы - | | | 


Σ ΡΕ; = Si, LEO; (3.8) 
является решением системы (3.6) и любое решение системы 
2 P13 = Np ГЕ, (3.9) 


является решением системы (3.7). Таким образом, мы полу- 
чили два условия, каждое из которых эквивалентно эрго- 
дичности Г. 

(е) Система (3.8) имеет единственное решение. 

(Г) Система (3.9) имеет единственное решение. 
Эквивалентность условий (е) и (Г) следует также из сопря- 
женности системы (3.9) системе (3.8). 

_ Мы показали, что сдвиг Т эргодичен в том и только том 
случае, если 4;;= Pj; доказательство опирается на (3.2). За- 


меняя в наших рассуждениях (3.2) на (3.1), видим, что Т 
обладает свойством перемешивания в том и только том 
случае, если -- : 
dm при oe Ρρ 1, = о. (3.10) 


Из теории ‘цепей Маркова известно, что (3.10) выполняется 
в том и только том случае, если матрица П неприводима 
и непериодична '). Здесь мы воспользуемся этим фактом без 
доказательства (доказательство см. в $ 11). 


ze ример 3.2. Преобразование сдвига можно определить 
Ha произведении элементов односторонней последователь- © 
ности экземпляров пространства о. Тогда элементом про- 


Ὁ) Не существует натурального т > 1, такого, что ρθ9 > 0 только 


для п, кратного πι. (В литературе по пепям Маркова возвратное нену- 
левое непериодическое состояние называют иногда эргодическим; см. 
‚Феллер [1]. Мы будем избегать такого употребления.) 
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странства Q является последовательность ® = (®, ®., ...), 
где «Е о; координатные переменные определяются, как и 
выше; Τ(ωι, ®.,...) = (Mg, @3,...), так что (То), = ®„.1. Функ- 


ции Pp, удовлетворяющие условиям (1.3) и (1.4), однозначно 
определяют меру P, сохраняющуюся при преобразовании Т. 
Это преобразование называется односторонним сдвигом. 
Односторонние сдвиги Бернулли и Маркова являются, оче- 
видно, частными случаями этого общего одностороннего 
сдвига. Заметим, что сдвиг в примере 1.2 (который мы теперь 
можем назвать двусторонним сдвигом) обратим, в то время 
как односторонний сдвиг необратим. 


Пример 3.3. Пусть Р’[Р”]— мера на пространстве 
(О, οἵ), где определен двусторонний сдвиг, относительно 
которой координатные переменные х.„с четными индексами 
независимы, принимают значение { с вероятностью р; и Xon= 
= Хоп! [Хоп = Хон ДЛЯ всех п с вероятностью |. Сдвиг T не 
сохраняет ни P’, ни Р”, но сохраняет их среднее арифме- 
` тическое Р =(Р’+Р”)/2, что следует из соотношений 


P’(B) для`четного k 

2. —k BS = 
В в)- | Р” (В) для нечетного В 

Р” (В) для четного К 

и —k ee ? 
Plt в)- | P’(B) для нечетного ᾖ. 


Из этих соотношений следует также, что 


п-1 
lim — Ἧς [P’ (A) Р’(Г*В)+Р” (A) Ρ΄ (T*B)] = Ρ (4) Ρ (В). 
n->oo ТП παν) 5 
Если Au B—wuuaungpu, то A и Т *В. независимы при P’ и P” 
для достаточно больших №. Следовательно, условие (1.8) 
выполняется. Тогда в силу теоремы 1.4 сдвиг Т эргодичен. 
Однако Tue обладает свойством перемешивания (если только 
одна из вероятностей р; не равна 1). 


Меры на интервале 


Обобщим диадическое преобразование из примера 1.6, 
заменив основание 2 основанием Fr > 2: 


_ Пример 3.4. Пусть Р — мера Лебега на классе  6o- 
релевских подмножеств полуинтервала © = [0, 1), и пусть 
преобразование 7 задано формулой п) Если 


- 
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[(ω) =i на [ἰ/τ, (i+ 1)/r), ЕО ЕР: ‘то точка Ὁ имеет 
по основанию Г разложение Σ Ge ‘o)/r”. Kak и в случае 
=] 


r=2, преобразование Т эргодическое (и даже перемешиваю- 
щее). Применение эргодической теоремы показывает, что 
почти каждое число нормально по г (содержит все знаки 
разложения в одинаковой пропорции). Обозначим символом 


Xn, (©) п-й знак разложения Ὁ по основанию г (т. е. f(T" a): 
тогда χι, Xo, ... образуют последовательность независимых 
случайных величин, где P{x,=—i=I1/r, i=0, 1,..., r—-1. 
Будем называть 7 г-адическим преобразованием. 


Пример 3.5. Определим ©, οἵ Ἡ Τ так же, как в пре- 
дыдущем примере, но пусть теперь Р — любая мера, которая 
сохраняется при преобразовании Т. Общий вид г-адического 
интервала (диадического при г=2) — [А/!”, (R+1)/r”); он co- 
держит точку ὦ в том и только том случае, если первые и 
знаков X,(@),..., X,(@) ее разложения (по основанию г) 
имеют заданные значения. Так как конечные объединения 
непересекающихся диадических интервалов образуют поле, 
порождающее οἵ, преобразование Τ᾽ сохраняет меру Р в TOM 
и только том случае, если оно сохраняет меру каждого 
диадического интервала, или, что эквивалентно, в TOM и 
только том случае, если последовательность {X,, Χο, ...} обра-. 
зует процесс, стационарный относительно Р. | 

Этот пример показывает, что результаты эргодической 
теории и теории вероятностей можно превращать в_резуль- 
таты, относящиеся к единичному интервалу, и обратно. Ha- 
пример, из эргодической теоремы можно получить теорему 
о нормальных числах. В качестве примера обратной про- 
цедуры выведем специальный случай теоремы существования 
Колмогорова из того, что функция распределения на еди- 
ничном интервале задает на нем меру. 

Пусть Р— мера на единичном интервале; мы сейчас не 
задаемся вопросом, сохраняется ли она при преобразовании 
Го = го (тоа 1). Пусть р, — функция, определенная Ha после- 


довательностях (i,, ..., &) длины Е знаков разложения по 
основанию г. Она задается формулой 
Pe (i, ...) iz) = P {χι (ὦ) =i), .. оу Xp (@) = ig}. (3.11) 
ree 7 | Pr (i,, Oe aed iz) > 9, 
Σ Pri (i, ..} tp, 1) = Pr (ἐν; ...) ip), (3.12) 


Хр =1 
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(эти соотношения формально тождественны условиям (1.3)). 
С другой стороны, пусть нам даны функции pz, удовлетво- 
ряющие условиям (3.12). Нужно построить на οἵ вероятно- 
‚стную меру P, удовлетворяющую соотношению (3.11). 
Определим функцию F г-адического рационального аргу-- 
мента μήτ’ & [0, 1] формулой 


ears = Ὲ Pr (i, Se i), _ (3.13) 


» 


где суммирование ведется по тем наборам i,, ..., if, для 


5 
которых He ae и. . Значения функции в точках и/!* и ги/г*+1 
=I : 

совпадают в силу второго из условий (3.12). Первое и третье 
из этих условий показывают, что Р — неубывающая функция 
и F(1)=1. Так как сумма, соответствующая точке 0, пуста, 
то F(0)=0. Сделаем еще одно предположение, состоящее 
в TOM, что для любой последовательности знаков ij, ..., iz 
разложения по основанию г выполняется соотношение 


tinge Е о 4) 
Ὁ -» © a ae 


о 


(Если имеет место (3.11), то это последнее условие должно 
выполняться, ибо не существует точки ®, разложение которой 
оканчивалось бы наг—1,г—1,....) Из(3.14) следует, что Е— не- 
прерывная слева функция г-адического рационального аргу- 
мента и, следовательно, может быть продолжена до функции 
распределения на [0, 1], т. е. до непрерывной слева !) неубы- 
вающей функции, такой, что Р (0) =0ирР (1) =1. Любой функ- 
ции распределения F на [0, 1] отвечает единственная вероят- 
ностная мера Р на οἵ, такая, что 


P[0, = F(x), O<e<1. 6.15) 


Отсюда и из определения F немедленно следует (3.11). 

Если Ри pp связаны соотношениями (3.11), то преобра- 
зование Г сохраняет меру Р в том. и только том случае, 
если 


Ρε (1...) ip) = ΣΡ а. in). 3 (3.16) 


') Непрерывность слева является здесь условностью, вызванной тем, 
что мы имеем дело с интервалами, замкнутыми слева, которые естественно 
связаны с разложениями, конечными в рациональном случае. 
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Если ру ..., Pr-1 неотрицательные числа, меньшие |, 
в сумме дающие |, и если 
Рь (1 ses i.) = Pi Pi, ++ Dye (3.17) 


то соотношения (3.12), (3.14) и (3.16) выполняются, так что 
Е Mapa Р на οἵ , удовлетворяющая условию (3.11) 


0,5 
Puc. Ι. 


и сохраняющаяся при преобразовании Т. В силу эргодиче- 

ской теоремы асимптотическая относительная частота, с ко- 

торой знак i встречается в разложении точки ®, равна р; 

с точностью до множества меры 0 (в смысле меры Р). Если 

Pine Me то F(x)=x, P—mMepa. Лебега и мы находимся 
в условиях примера 3.4. 


Займемся теперь случаем г=3, и пусть. ру = 1/2, p,; =0, 
р. = 1/2. Тогда, согласно определению (3.13), Е — функция 
Кантора; соответствующую меру Р будем называть мерой 
Кантора. Множество точек ®, содержащих в своем разло- 
жении по основанию 3 re 0, 1, 2 в относительных пре- 
дельных пропорциях 1/2, 0, 1/2, имеет меру Кантора, рав- 
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ную 1, и меру Лебега, равную 0. Таким образом, функция 
Кантора сингулярна '). 

Совершенно аналогичным образом убеждаемся, что если 
Е строится с помощью функций (3.17), то она сингулярна, 
если только р; не равны тождественно 1/7. Если ни одна 
из р; не равна 0, то Е — строго возрастающая функция. 
На рис. | представлен график функции F в случае г =2, 
ри = 0,7, р, =0,3. Если эта функция выглядит лучше функции 
Кантора, то это только потому, что график ee вычерчи- 
‘вается с точностью до толщины линии. Части графика, со- 
ответствующие отрезкам [0, 1/2] и [1/2, 1], идентичны с точ- 
ностью до масштаба вертикальной оси, и каждая из этих 
частей с той же оговоркой идентична всему графику. Именно 
этим свойством воспроизведения °) должна обладать функ- 
ция F, для того чтобы знаки диадического разложения 
Xx, (©), Хо (©), ... образовывали процесс Бернулли с соответ- 
ствующей мерой Р. 


Теорема существования 


Специальный случай теоремы существования Колмого- 
рова, нужный для одностороннего сдвига (пример 3.2), сле- 
дует из уже рассмотренного, так как любая мера Р на ин- 
тервале может быть перенесена на пространство последо- 


вательностей элементов множества о = {0, 1,..., г— 1} с по- 
мощью отображения ®-> (х, (в), х. (в),...). Построив меру 
на произведении 9 XO X ..., можно, конечно, . заменить о 


любым множеством из г элементов — пространство состояний 
совсем не обязано иметь своими элементами знаки разло- 
жения по основанию г. Нарушение предельного соотноше- 
ния (3.14) соответствует вр XO X ... точке с положитель- 
ной вероятностью. Так как нетрудно построить точечные 
массы в этом пространстве, то вн. (3.14) можно опу- 
CTHTb. 

Это рассуждение показывает, что если функции Pz, на по- 
следовательностях длины Καὶ элементов из р удовлетворяют 


1) Носителем вероятностной меры Р является такое множество А, 
что Р (А) =1. Две вероятностные меры сингулярны одна относительно 
другой или взаимно сингулярны, если у них существуют непересекаю- 
‚ щиеся носители. Функция распределения сингулярна, если соответствую- 
щая „мера сингулярна относительно меры Лебега. 

2)- Это напоминает мальчика, изображенного на обложке журнала 
рассматривающим эту обложку, и т. д. до бесконечности, только здесь 
он видит себя на каждой из двух смежных внутренних страниц. 


4 Зак. 1491 
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условиям (1.3), то существует вероятностная мера Р на 
oxXoxX ..., такая, что 


РЕ ip) = P {x,(@) =й, ..., Xp (0) =}, 
где х,— координатные переменные '). Если верно соотноше-. 


ние (1.4), то мера Р сохраняется при одностороннем сдвиге. 


Этот результат можно распространить на двусторонний 
сдвиг следующим образом. Пусть ф отображает простран-. 
ство @бхрх —. на пространство... KOK MOK 
по формуле 


ф (©, ®,..)=С.., 64, 65, O1, (η, ©; ΠΣ 


где ὧι стоит на нулевом месте в образе последовательности. 
Заданные функции р,, удовлетворяющие условиям (1.3) 
и (1.4), определяют новые функции 


Pia а ‘=| 
Для а рт выполняется (1.3) (но (1.4) может не AOA 


няться), и, следовательно, существует мера Р* нар. Хох..., 
такая, что 


Dgligets «++ bay bo, И, ig, «+, в) Для нечетного К, 
Die (igs «.... bay №, И, 13, :.., tei) ДЛЯ четного К. 


(п, .... в) =Р*(х, (@) =i, .... αι(ω) -- ἐς]. 


Для меры ΡΨ! на... ΧΡ XOX X выполняется COOTHO- 
шение (1.2), и она сохраняется при двустороннем сдвиге. 
Таким образом, мы получили доказательство того специаль- 
ного случая теоремы существования Колмогорова, который 
встретился нам в примере 1.2. 


} - 


1) Действительно, если условие (3.14) не выполняется, ΤῸ существуют 
‘такие последовательности 11, io, ... в (ig A г-— 1), что 


lim Bee fo pan} 1 ee Le 
peel be (1 ips 1 — Ie (41 р) 


Заменим ри (и, ..., in) Ha 
7 . . Ἔν | . e i ° 
Ри (ἐν ΕΟ 1) = Ba D3 : Чи (1, ae ln πε} °°? inst): 


ney cet? Iya] 
- ; 
Тогда система чисел р, будет удовлетворять первым двум условиям . 


(3.12) и условию (3.14). По этой системе можно построить меру на 
ΡΧΟᾺ ..., которая, однако, . не будет нормированной. Остается теперь 
каждой точке ®= (1, ..., 2, r—1, ...), ig 5 г-—1, приписать меру, рав- 
‚ную 9 (ij,..., dg). — Прил. ред. 
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ee a A -οππο--- επαο--πκκπτπτ-τ--- 


Эргодичность Η экстремальные точки 


Рассмотрим вероятностную меру, сохраняемую некото- 
рым фиксированным измеримым преобразованием Т на не- 
котором фиксированном измеримом пространстве (2, οἱ). 
Назовем меру Р эргодической, если относительно этой меры 
эргодично преобразование Т. Мы покажем, что если меры P; 
и Р. эргодические, TO они либо совпадают, либо взаимно 
_сингулярны. (Частный случай этого общего утверждения 
мы использовали при доказательстве сингулярности функ- 
ции Кантора.) В самом деле, если Р; и Р. не совпадают, 
то Р,(А) == Р.(А) для некоторого А из οἵ ; если А; — MHO- 
жество точек Ὁ таких, что 


--] 


‘ 1 ᾿ р a 
tim τ δὶ Γα(Τ"ω) =P; (A), 


то А, и.Д, не пересекаются и P;(A;)=P,(A,)=1, так что 
P, и Ρο взаимно сингулярны. 

Отсюда следует, что если Р-— эргодическая мера, а P, 
абсолютно непрерывна относительно Р (и, следовательно, 
тоже эргодична), то меры эти совпадают, так как они 
не могут быть взаимно сингулярны. Если Р не эргодична, 
определим меру Р, равенством P,(B)=P(B| A), где А- ин- 
вариантное множество и О<Р(А) < 1. Тогда Т сохраняет РУ, 
а ΡῚ отлична от Р и абсолютно непрерывна относительно 
нее. Таким образом, Р эргодична в том и только том слу- 
чае, если не существует такой меры Р, (сохраняющейся при 
преобразовании Г), которая отличалась бы от Ри была бы 
относительно нее абсолютно непрерывна. - 

Предположим теперь, что Р является взвешенной сред- 
ней двух мер Р, и Ρο. Иными словами, пусть P = a,P,+ а.Р. 
(т.е. Р(В)=«аР, (В) + а.Р.(В) для всех В из οἵ), где 
aa,>0, a,+-0,=1 Ἡ Р, "ЕР.. Тогда P; отлична от Р и 86- 
солютно непрерывна относительно нее, и, значит, Р не эр- 
годична. А если так, то существует нетривиальное инва- 
риантное множество A, так что P(B)=P(A)P(B|A)+ 
+ P(A‘) P(B| A‘) дает представление Р=аР, + о. Р.. Итак, 
Р эргодична в том и только том случае, если она не может 
быть представлена в виде взвешенного среднего двух веро- 
ятностных мер, сохраняющихся преобразованием Т. (Эрго- 
дическая мера Р может быть, разумеется, взвешенным сред- 
ним вероятностных мер, не сохраняющихся преобразова- 
нием Г; см. пример 3.3). 


4* 
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Конечные меры Ha ef образуют линейное пространство; 
вероятностные меры, сохраняющиеся при преобразовании Τ, 
образуют выпуклое множество в этом пространстве. Мы no- 
казали, что эргодические меры являются как раз экстре- 
мальными точками этого выпуклого множества. 


Замечание. Функционалы от цепей Маркова дают 
примеры сдвигов, которые обладают свойством перемеши- 
вания, не будучи марковскими сдвигами; см., например, 
Розенблат [1]. Более подробные сведения, касающиеся при- 
мера 3.5, можно найти в работе Харриса [1]. 
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ΗΠ реобразование 


Любое число ® из единичного интервала можно пред- 
ставить в виде простой непрерывной дроби’) 


Lg ae (4.1) 


а 


о + 


где элементы а„-— положительные целые числа. Это пред- 
ставление конечно в том и только том случае, если ὦ ра- 
ционально. 

Для, изучения о. свойств знаков разложения 
числа ® по основанию г используется г-адическое преобра- 
зование То = го (то@Я1) на единичном интервале (при-. 
мер 3.4) —знаки разложения Го являются сдвинутыми на одно 
место знаками разложения ®. Существует преобразование, 
аналогичным образом сдвигающее элементы а„, которое 
может быть использовано для изучения их эргодических 
свойств. Ἢ 

Пусть Ὁ имеет представление (4.1), а другая точка еди- 
ничного интервала Θ΄ имеет представление 


Тогда 


a, о’ ? 


так что число 1/m имеет своей целой частью [1/ω] элемент αι, 
а дробной частью {1/0} — число ®’. Будем изучать преобра- 
зование, переводящее ὦ в {1/6}. 


') Об элементарных свойствах непрерывных дробей см., например, 
Харди. и Райт [1] или начало книги Хинчина [4]. 
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Пусть пространство ® есть полуинтервал [0, 1), а поле F 
состоит из его борелевских подмножеств. Определим пре- 
образование Т формулой 

{1/ω}, если ὦ #0, 
То = 
0, если ® =0. 
Если 


α(ω) -[ [1/ω], если ® 0, 


со, если o = 0, 


а» (0) = a(T"o), ae Dic 


TO ay (@), а>(®),... являются как раз элементами непрерыв- 
ной дроби, представляющей ©'). 

Нам потребуются некоторые результаты, касающиеся 
непрерывных дробей. Определим целозначные функции р» (©), 
4» (®) рекуррентными формулами: 


Ρ-ι (©) = πες. I, Po (@) = Επ 0, Ри (<) aes a, (@) ри (©) + Pn-2 (в), п => 1; 
(4.2) 
9, (6) =0, q(o)=1, 9,(@) =a, (ὦ) 9,_,(@) + 9,5(@), 521. 
(В рациональном случае p,(@) и g,(@) определены только. 


до тех пор, пока а„(®) конечны.) Стандартные рассуждения, 
использующие индукцию, показывают, что 


В Е (4.3) 


| а: (©) | ап-1 (©) |4. (©) + Т" ? 
Ри-1 (©) Gn (©) — р» (ὦ) qn-1 (ω) =(— 1)", n>0, (4.4) 
а р | 
lato) = Е. [an (@) +1 


Положив в (4.5) 1=0, получаем формулу для п-го прибли- 
жения: 


И 


1-1» 1 |. ρείω) 
ем. о — Gn (©) ° 


Соотношения (4.3) и (4.5) дают 


Ви (ὦ) + (7Т”®) ри-1 (@) 
ди (ὦ) + (То) dn—1 (©) ’ 


') То =0 для некоторого п в том и только том случае, если ὢ ра- 
ционально. Условимся считать элементы аи (®) бесконечными при п > Κ, 
если наше представление — конечная К-членная непрерывная дробь. 


7 
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и, используя (4.4), получаем 


_ Рв (©) — nee 
gn(®) | qn (6) ( (Te) (ὦ) + gn-1(@)) ° 
Tak Kak | 
= Ons (o)< (Τ”ω)' < Ant (©) + 1, 
TO 


; 


qn Gn (©) Физ (©) (n> 1). (4. 6) 


1 _ Pn (@) 
дв (©) (Qn (©) + ᾖπει (©) ) = | = дв (ὦ) I< Ses 


Наконец, нам Е es 


In | < Е. и. 
| Pn (©)/9n (ὦ) ce te! 14: 
Справедливость его при п=1| может быть установлена не- 
посредственной проверкой. Так как по соображениям индук-_ 
ЦИИ | | | 
Pn (ω) 20, 4, (в) 22" ", п>2, (4.8) 
то Е 

© Е 1 -- 9 

νε Ἔν ο«ιο 


Для п>2. неравенство (4.7) следует из последнего нера- 
венства. . - 


Пусть az, R=1, ..., п, — положительные целые числа \). 
Обозначим символом Аа.... а множество точек ® таких, 
что а, (9) =a), ..., a,(@)=a,. Множество Aa, ... ἂμ, кото- 


poe мы будем называть фундаментальным интервалом 
ранга и, играет здесь ту же роль, что г- адический интервал 
при изучении разложений по основанию г. Множество Аа... а, 


является образом полуинтервала [0, 1), полученным с по- 
мощью функции tha, ...a,, определенной равенством 


ΞΕ Ϊ RS Be aor 
‘pa, cel See: Eilat. lap eae? 0O<i<1. 
Из самого вида функции ясно, что Ya, ...а, Убывает при 
нечетном пи возрастает при. четном и. В силу (4.5) имеем 


Ра + ἵρη-ι | 
A, a, (1 Sy 5, Е | (4.9) 


1) Не путайте с функциями ар (6); чтобы избежать недоразумений, 
мы не будем опускать аргумент © при записи этих Pees (а также 


функций Pp (®) и qx (6) )- 


~y 
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где р, и д, определяются через элементы а, рекуррентными 
соотношениями, подобными (4.2). Поэтому 


|| 22 δα Έτη}, если п четно, 


A Qn’ Чи + 9и-1 
а... Ay + 
| | 2a Pn-1 : Po) , если п нечетно. 
Оп - Gn-1 qn ; 


Из соотношения (4.4) следует 


1 - 


i a, +++ αρ) Gn (Qn + dn-1) >> 


_ (4.10) 


где A означает меру Лебега. Таким образом, фундаменталь- 
ные интервалы ранга nm образуют разбиение пространства Q 


-- » -- ty 
на интервалы длины, не большей 2 ” В частности, класс 
всех фундаментальных интервалов порождает о-поле cf 
борелевских множеств. 


Мера Гаусса. 


Легко видеть, что преобразование Т не сохраняет меру 
Лебега A. Однако на т мера, которая, как мы 
‚увидим, сохраняется при р Т, а именно мера 
Гаусса 


Р(А)= AGH. | (4.11). 


ay ΤΈΣ» 
A 


Так как P и Л абсолютно непрерывны относительно друг 
друга, то соответствующие им множества меры 0 совпа- 
дают. Таким образом, если последовательность элементов 
а! (©), а. (©),... обладает некоторым свойством почти всюду 
относительно Р, то она обладает этим свойством и почти 
всюду относительно A. 

` Для того чтобы доказать, что Τ сохраняет Р, достаточно 
показать, что оно сохраняет меры отрезков [0, a]. Так как 


я - Ula =} 


то нужно проверить только выполнение равенства 


а 
[ΤτΕ 
δ 


ος ИЕ 


=>. | ote 


k=1 1/(R+Q) 
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Равенство справедливо, поскольку А-й член в правой его 
части равен 

1 1 
пп (1+) м (1+) = 


ах 


α/ 
=In(1+)- п (1+ г) = Γ ΓΈ 
a/(k + 1) 


Докажем теперь, что ТГ эргодично относительно Р. Фик- 
сируем αι... η и будем обозначать Фа, ...а, Через ф и 
А. ... а, Через А„. Длина интервала A, равна + (ф(1) —1(0)), 
и ели OS xX<y<l, то длина интервала 

{fo:x <T"o<y}N A, 


равна + (p(y)—w(x)) со знаком + или — в зависимости 
от того, четно или нечетно п. Поэтому 


λ(1'"[α, 9)|A,) ИУ. 
В силу (4.9) и (4.4) имеем 2 | 


А (т, 1) = ии. (4.19) 


Так как второй множитель в Е части равенства лежит 
между гит: то 


ТА (А) (ГА А,) <2A(A), | 419 


где A=[x, у). Тогда (4.13) справедливо и в случае, если 
А -— объединение непересекающихся интервалов, следова- 
тельно, справедливо для любого А из 

Tak как плотность меры Гаусса, определенной выраже- 

нием (4.11), всегда находится между 1/2 ш2 и 1/п2, το 


^(М) — τ Ϊ | 

one SEIS ‚ МеЕЯ. . (4.14) 
Из (4.13) следует, что 

-Р (А) ЗР(Т"А|А,) < СР (А) (4.15) 


для всех А из οἵ, где С — абсолютная константа (С = 4/In 2). 

Предположим, что Α-- инвариантное множество. Тогда. 
C'P(A)<P(A|A,) и, следовательно, если P(A)>0, το 
C'P(A,) <P (А, | A). Поэтому неравенство 


4. P(E) <P (EIA) _ (4.16) * 
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выполняется для конечных объединений Ё непересекающихся 
фундаментальных интервалов. Поскольку эти множества 
образуют поле, порождающее οἵ, то (4. 16) верно для лю- 
бого E из οἵ. Если ‘положить E = A‘, то получаем, что P(A) 
должна равняться 1. Поэтому Т эргодично относительно Р. 

Из эргодической теоремы следует, что если ᾗ — интегри- 
руемая функция на единичном sat πες TO 


п-—1 
= 1 
lim = YF (Te) = ol. πώ. ἄχπ.α.. (4.17) 
ый 0 


Здесь не имеет значения, к какой мере, Р или А, относятся 
слова „интегрируема“ и „п. в.“ ‹ 

Пусть |[-— характеристическая функция множества 
{ο а, (©) =k}. Тогда асимптотическая относительная частота, 
с которой число k встречается Sperm элементов а; (@), а>(®),..., 
почти всюду равна 

ИЕ | 
ae [ ght = yl t re 
In 2 151 In 2 К (Е-+ 2) ᾿ 
1/(k+1) 3 


В частности, последовательность элементов а! (6), а. (@), ... 
почти всюду неограниченна. 
Положив } (®) = па! (®), видим, что 


АЯ 1 \Ink/ln 2 
sib γαι (a) a ae: 55 ©) + πε П. В. 


Если | (®) = а, (®), то интеграл от f расходится к +. Мы 
приходим с помощью формальных операций к предельному 
соотношению . 


. αι! προς Ωμ \O 
ia а! (®) +... +4n (©). = 00 Jt В. 
n-> oo. = : 
С помощью усечения нетрудно доказать это строго. 
В применениях к диофантовым приближениям для нас 
важнее величина JG, г чем а„ (0). Мы докажем, что 


мт ~In G,(@) = Π. В. (4.18) 


ος 


Покажем сначала, что 


ЕЕ Е Е 
in (©) IT (re, @ ts +tm@): 4-19) 
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Из рекуррентных соотношений (4.2) с помощью индукции 
получаем P jx а и поэтому. 


| = °Рп+1-Ё {5 ω) 
ΠΝ Ч п+-1-Ё (Τ’-!ῳ) a 


так как числитель А-го множителя в правой части сокра- 
щается со знаменателем (k + 1)-го множителя. Но, (4.20) есть 
как раз (4.19). | 
В силу (4.7) имеем 
| ап (@) 


k=l Ϊ Ely | 
In T ὦ — In cot го» | Г, 1 <= и, 


и, следовательно, в силу (4.19) 


Σ 1 . = п es п 0 
In = In T τ Мет ‚10|<1 
Поэтому 
п-—1 
1 1 0 
= 4, (6) =—- У, Шо +4, |0 |<1. (4.21). 
k=0 
В силу ЕЕ теоремы | 
a k 
tim | Σ inte .|- т [ша | п. В. 


Интегрируя по частям, получаем 


Таким образом, (4.18) следует из (4.21). 

Соотношение (4.18) имеет несколько простых, но инте- 
ресных следствий. Например, используя (4.6), получаем 

ЕСТЬ 2 oe 

| ες п [о Чт (0) | 612 


Il. B. 


Taku образом, расхождение между @ и его N-M прибли- 
жением почти всюду порядка ens 132, cade, если A, (@)— 
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фундаментальный интервал ранга п, содержащий ὦ, TO 
-в силу (4.10). 


IU 
| lim = (А, ως ota Se Π. В, 
Наконец, в силу (4.17) имеем 
lim = InP (An ет В. (4.22) 


n> oo 


Применение Κ диофантовым приближениям 


Пусть {Ωρ} -- последовательность положительных чисел 

Ἡ E, означает событие {a, (ὦ) >a,}. Так как величина P(E,) = 

_ =Р{а, (®)>а,„} порядка 1/@„, то из леммы Бореля — Кан- 

телли следует, что если » 1/а, сходится, то число насту- 

плений события а„(®)>о9,„ конечно, за исключением, быть 
может, множества меры 0 (относительно Р или A). 


Предположим, что У 1/а, расходится. В силу (4.15) 
: | 
г 
P (Ens Δὲ) > Clan ΕΠ 
для любого фундаментальчого ‘интервала ранга и, где 
С’— абсолютная константа. Поэтому 


P{Enf ... ПЕ) < В) 
i=0 


Если >) l/a, расходится, то произведение стремится к 0 
при Е -—> со; следовательно, | | 


Р (EmMEmtif) -..)=0. 


Так Kak это верно для каждого m, то число наступлений 
события a,(o) >a, бесконечно, за исключением, быть может, 
множества меры 0. Мы можем теперь сформулировать сле- 
‘дующий результат. 


Теорема 4.1. Число наступлений события a,(o)>a, 
‚бесконечно с вероятностью 0 или 1 в зависимости от того, 
‘сходится или расходится У 1/dp. 

Этот результат и соотношение (4.18) приводят к следую- 
щей фундаментальной теореме метрической теории аппрокси- 
мации: 


Теорема 4.2. Пусть i (9) — положительная функция на- 
турального аргумента oh (a) BEA gf (4) — невозрастающая 


? 
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функция и Ка =о5, то для почти всех ὢ неравенство 
9 
cop Г (4) | 

Jo—2| <i | (4.23) 


имеет бесконечно много решений в целых ри q. (b) Если, 
У (а) < ©, то для почти всех ® неравенство (4.23) имеет 
4) «τ 


не более чем конечное число решений. 


Доказательство. (а) Выберем и зафиксируем нату- 
ральное № (скажем, N=4), такое, что In Мои In2. Из 
(4.18) следует, что ен 


— ~1n Gn (@)<1n М (4.24) 


выполняется с точностью до множества меры 0 для всех, 
кроме конечного числа, значений п. Если ф (п) = ΝΝΝ᾽), то, 
поскольку g/(g) не возрастает, имеем 

М! 1 


>, К <12 М. φ(η), 
д=мМ 


так что > φ(η) расходится, если расходится DS f(g). Из 
n | 9 


теоремы 4.1 вытекает, что р 


@п+1 (6) ет (4.25) 


can 
с точностью до множества меры 0 справедливо для беско- 
нечно многих и. 


Если выполнено неравенство (4.25), то в силу (4.6) 
и (4.2) 


Pn (Ο).. | 1 _Ф (и) _ 
а 


gn (6) Gn (©) φημι (©) ~~ алла (6) Gn дв (@)? * 


Ho если (4.24) также выполнено, так что Чь (0) < №", TO” 
‚в силу того, что gf(g) не возрастает, имеем 


p(n) = М TIN") S 4» (@) F(4n (©)), 


так что 


ри (©) | _ | (qn (©) ). 
ди (6) Gn (©) 


Так как неравенства (4.24) и (4,25) с точностью до множе- 
ства точек ® меры 0 выполняется одновременно для беско- 
нечного множества значений и, то часть (а) теоремы 4.2 
доказана. | : 


®- 
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Часть (b) вытекает из простых свойств меры Лебега. 
Если Н.-— множество точек ὦ, для которых неравенство 
(4.23) выполняется при каком- нибудь натуральном р, то Но 
является объединением интервалов длины 2] (4)/4 с ‘центрами 
в точках вида p/g. Так как таких точек на единичном а 


вале только 4, то 
^(На) < 27 (4). 


Таким образом, часть (b) следует из леммы Бореля — Кан- 
телли. 


Перемешивание и проблема Гаусса 


Усиление нашего доказательства эргодичности преобразо- 
вания Т дает нам новые сведения. 
Пусть &„ есть о-поле, порожденное множествами вида 


{o: a, (0) = а} при k>n, и пусть &,= Π $, Множество из 
n=] 

0-поля &,., которое мы назовем хвостовым !) σ- полем, зависит 

только от „бесконечно далекого будущего“. Покажем сна- 

чала, что любое инвариантное множество „почти“ лежит 

в этом хвостовом о-поле, т. е. если A инвариантно, TO 

Р(А+ В) =0 для некоторого Ве... Так как AGF, то 


Т"Ае 9, даже для неинвариантного А. Но если А строго 


инвариантно, TO A=T "AGE, для всех n и, Е 
АеЯ.. Если же А просто инвариантно, то Р(А- В) = 
для некоторого строго инвариантного множества В. | 

Так как в &,, существуют множества, не являющиеся 
‚строго инвариантными 7), то, ‘возможно, 5. содержит 
множество A, для которого 0< P(A)<1, даже если Т эрго- 
дично. (Если бы Т не было эргодичным, TO &„ содержало бы 
такое множество A, так как инвариантные множества „почти“ 
лежат в 5.) Если P(A)>0, то для любого п множество А 


имеет вид А=тТ””В, где Вес. Но в силу (4.15) 
4 P(A)=4 P(T"B) = Р(В)ЗР(Г”В|А,)=Р (AI An). 


_ для любого фундаментального интервала A, ранга п. Так как 
P(A)>0, то C'P(A,)<P(A,|A). Каки раньше [см. (4.16)], 
отсюда следует, что Р (А) =1. 


1) В отечественной литературе принят термин „остаточное о-поле“. — 
Прим. ред. 
_ 2) Например, множество точек ®, для которых аи (ὦ) =1 при беско- 
нечном множестве четных значений п. 
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Таким образом, хвостовое о-поле YF, тривиально в TOM 
смысле, что оно содержит только множества меры 0 или 
|, — условие не менее сильное, чем эргодичность. В действи- 
тельности, как мы увидим позже (в конце $ 11), из этого усло- 
вия можно сделать вывод о перемешивающем свойстве 
_ преобразования Т. 

В письме к Лапласу τ Гаусс утверждал, что 


в (1 +x) 


lim A{o: ο είς 9 


n-> © 


РПО, x) (4.26) 


для каждого х из единичного интервала, и интересовался 
оценкой ошибки при использовании п-го приближения. За- 
пишем (4.26) в виде 


lim | (In 2)(1 +) Ρ (άω) =Р(4), — (4.27) 


n> oo 
ТА 


где А = [0, x). Из того, что преобразование Т является пере- 
мешивающим относительно меры Р, вытекает, что 


lim { f(o)P(do)=P(A) { (о) P(do) 
п> о ТП 0 


для любой характеристической функции] и любого боре- 
левского множества А. Так как функция (2) (1 +) равно- 
мерно аппроксимируема ступенчатыми функциями, то имеет 
место (4.27) (для любого борелевского множества A). Таким 
образом, утверждение Гаусса вытекает из того, что преоб-. 
разование Т является перемешивающим. 

Другие методы показывают, что перемешивание равно- 
мерно экспоненциально, т. е. 


Р(Г"" Al Ay) =Р(А) (1 + 0"), (4.28) 


где |0|<К, К и о-— положительные константы (ρ « 1), не. 
зависящие от А, п, Ки Δι. Отсюда следует, что сходимость 
в (4.26) равномерна и экспоненциальна. 


Замечание. Многие из приведенных результатов, вклю- 
чая теорему 4.2, доказаны Хинчиным [1,2]. Его доказатель- 
ства осложнены тем, что он не использует эргодической 
теоремы. Дёблин [1, стр. 336], по-видимому, первым дока- 
зал (4.17) во всей общности, применяя эргодическую теорему. 


1) Это письмо цитируется Успенским [1]. Не ясно, каким доказа- 
тельством этого утверждения располагал Гаусс. 
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Другое доказательство эргодичности преобразования Т см. 
в работе Рыль-Нарджевского [1]. 
Кузьмин [1] первым доказал и 26), он получил оценку 


ошибки аппроксимации порядка ρ΄», Леви [1, 2] улучшил 
ее до ρ΄, доказав (4.28). Дёблину [1] принадлежит другое 
доказательство соотношения (4.28) и еще много вероятност- 
ных результатов относительно непрерывных дробей. 

Существует класс теоретико-числовых- преобразований 
единичного интервала, содержащий в виде специальных 
случаев преобразование непрерывных дробей и преобразова- 
ние ®-—> го (тоа 1); см. Реньи [1] Ἡ Рохлин [3]. 

Кац [1] исследовал различные связи между теорией 
‘вероятностей. и другими ‘областями математики. 


ГЛАВА 2 
- Энтропия 
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Существуют такие пары сохраняющих меру преобразований, 
которые, будучи формально различными, по существу совпа- 
дают. Сдвиг Бернулли ни в каком существенном отношении 
не изменится, если элементы пространства состояний о οὔο- 
значить по-новому. Очевидно также, что вращение единич- 
ной окружности Го = с® (пример 1.5) не отличается от пре- 
образования То = ® - (аго с)/2л (то4 1) единичного интервала 
с мерой Лебега, а диадическое преобразование То = 2a (mod 1) 
единичного интервала не отличается от преобразования То= о" 
единичной окружности с мерой Лебега. 

Несколько более глубокий пример дает сравнение пре- 
образования Го = 2о (тоа 1) на единичном интервале и одно- 
стороннего сдвига Бернулли с пространством состояний 
о = {0, 1},’р,= р, = 1/2. Если мы сопоставим точки единич- 
ного интервала и элементы прямого произведения р XOX... 
с помощью соответствия 


0, 0 Фо... <> (@,, Wo, .. -) 


(мы Ha время игнорируем неоднозначность диадических раз- 
ложений), то множества соответствующих точек (например, 
левый полуинтервал и цилиндр {о: x, (6) = 0}) имеют одина- 
ковую меру и оба преобразования действуют по существу 
одинаковым образом, ибо одно переводит точку 0, ®1 в... 
в 0, юю....; а другое — точку (ор Ὡς, .--} 


Изоморфизм 


Необходимо ввести понятие изоморфизма для сохраняю- 
щих меру преобразований, подобное понятию изоморфизма, 


скажем, для групп. Пусть Г и Г- сохраняющие меру пре- 
образования, определенные на вероятностных пространствах 


(О, ¥, P) Ἡ (©, $, Б) соответственно'). В качестве предва- 


1) Далее всюду, где специально не оговорено противное, ‘предпола- 
гается, что все преобразования 7, Т ит. д. сохраняют меру. 
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рительного определения возьмем следующее; преобразова- 
ния Tu T изоморфны, если существует отображение @ про- 
странства_ 9 на © такое, что 1) ф взаимно однозначно; 
2) если А=ФА, то АЕ в _том и только том случае, 
когда AG , при этом P(A) = P(A); 3) равенство φῶ = Τφω᾽ 
выполняется для всех ®. Условия | и 2 требуют, чтобы 
отображение ф сохраняло структуру измеримых пространств 
(0, οἵ, Ρ) Ἡ 6 αἵ, P). Условие 3 требует, чтобы φ пере- 
водило Тв Т: один и тот же результат получается незави- 
симо от того, каким из двух путей совершается переход от 
верхнего левого,® к нижнему правому Ов диаграмме 


+O 
ol | 
У _ у 

Q—>Q 
Пары преобразований, рассмотренные в начале этого 
параграфа, изоморфны в указанном смысле, но все же дан- 
ное определение неудовлетворительно. : Предположим, что 
Т — тождественное преобразование пространства Ω, состоя- 


щего из одной точки, a J — тождественное преобразование 
пространства ©, состоящего из двух точек с массами Ои1 


(<Я состоит из всех четырех подмножеств). Хотя отображе- 
ния ф, Подобного описанному выше, не существует. уже 


потому, что пространства @ и ® имеют разные мощности, 
преобразования Г и Т по существу одинаковы — точка про- 
странства @ с массой 0 не должна идти в счет. Вследствие 


неоднозначности диадических разложений для приведенного 
выше соответствия 


0, о... <> (@1, @, ...) 


возникает аналогичная трудность. 
Нам нужно определение, которое было бы нечувстви- 
тельно к множествам меры 0, т. е. такое определение, кото- 


рое признавало бы преобразования Т и Т изоморфными, 
если они становятся изоморфными после выбрасывания 
множества меры 0 из одного или из обоих пространств Q 
и ©. Пусть теперь QQ) есть то, что остается. после удаления 
из @ некоторого множества меры 0, т. 6. ©, — множество 
ИЗ ef меры 1. Тогда Т может рассматриваться как пре- 
образование, определенное лишь Ha (ο, в том и только TOM 


` 


5 Зак. 149] 
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случае, если оно переводит ©, в себя: То принадлежит 0. 
всякий раз, как Ὁ принадлежит Ф,, или, что то же самое, 


-1 
Q,>TQ, (или, что то же, ВСЕ Ωρ). Будем теперь считать Т 
и Т изоморфными, если, будучи суженными до преобразова- 
ний, действующих на HOAMHO ReCTB AX Qo и By, удовлетворяю- 


щих соотношениям Q,C TQ) и Ως 2 ‘Oo они становятся 
изоморфными в смысле предварительного определения: ‚Это 
приводит к следующему определению. 


Пусть существуют множества Q, из «Я и Q us &, 
имеющие меру 1, и отображение ф множества % на В. 
обладающие следующими свойствами. 

(11) Отображение ф взаимно однозначно. 

(15) Если ACQ) и А=ФА, то AGF 6 том и только том 
‘случае, когда ASF, при этом Р(А)= P(A). 

([3) Имеют место соотношения 


аще TG), =. 45A) 
OST Не В, (5.2) 

и, наконец, eee 
| фТо = Too (5.3) 


выполняется для любого ὢ из QQ). 

В этом случае мы говорим, что преобразования т u Τ 
изоморфны (точнее, изоморфны (©, ¥ , Ρ, Т) и (©, ¥, P, T))). 
Для того чтобы подчеркнуть роль множеств Qo, 0, и OTO- 
бражения ф, можно говорить, что преобразования Τ᾽ и T 


изоморфны относительно тройки (Qo, Qo, $). 
(Условия (1) и (15) представляют собой определение оди- 


наковости самих пространств с мерой (Q, fF ,P) xu (О, о. Р). 
Условие ([3)— только в нем фигурируют преобразования T 


и Т— утверждает, что эти преобразования абстрактно тожде- 
а ) 
Следующие замечания содержат ‘утверждения теории 
меры относительно нульмерных множеств, нужные для точ- 
ной трактовки понятия изоморфизма. i 


1) Это понятие иногда называют изоморфизмом- по модулю 0, или 
изоморфизмом по модулю множеств меры 0, или почти изоморфизмом. 
Отказавшись от предварительного определения, можно опустить подоб- 
ные уточнения, 
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Замечание 1. Данное выше предварительное опреде- 
ление соответствует частному случаю, когда можно выбрать 


тройку (Ωρ, Qo, ф) таким образом, что Q,=Q u Ωρ =0. Тогда 
равенство 


Т"ф'А=ф T"A | ` (5.4) 


ὶ 


~ 


верно для любого подмножества А множества © и любого 
п > 0. 


-- 


Замечание 2. В связи с соотношением (5.3) заметим, 
что если © EQ), то go = О,, так что в силу (5.1) и (5.2) To 
и Тфо принадлежат множествам ©) и ©, соответственно. 
В этом случае условие (5.3) требует соответствия точек То 


и Гфо относительно отображения φ. Ослабим условие (1.), 
опуская требования (5.1) и (5.2) и предполагая только спра- 
ведливость (5.3) всякий раз, как элементы ® и Го оба при- 


‘надлежат множеству (Δρ. Если тройка (%, (Οι, φ) удовлетво- 
ряет условиям определения, где (1.) ослаблено указанным 


образом, то преобразования Т и Т не обязательно изо- 

морфны относительно тройки (Ωρ, О’, φ), но легко видеть, 

что они изоморфны относительно тройки (Q,, Ωι, φι), где 
-ο0 . 


= (TQ), Q,=92, и 9,—cyxKenne ф на Q,. (На самом 
 n=0 
деле преобразования Т и Т изоморфны, даже если вместо 
условия (13) мы потребуем, чтобы (5.3) выполнялось всегда, 


когда имеют место соотношения © EQ), Тое О, и Тфое=О0..) 


Замечание 3. Мы должны показать, что изоморфизм 
является отношением эквивалентности. Очевидно, что пре- 
образование Т изоморфно самому себе; следовательно, изо- 


морфизм рефлексивен. Если Т изоморфно Т относительно 
тройки (Qo; Ok, ф), TO г изоморфно Т относительно тройки 


(Ωρ, О, 9); следовательно, изоморфизм симметричен. Для 
доказательства транзитивности изоморфизма нужно показать, 
что если Т изоморфно ИР изоморфно третьему преобра- 
зованию 7” (определенному на пространстве (Q’, ¥’, P’)), 
το Т изоморфно 7’. Допустим, что Т изоморфно. Г относи- 
тельно тройки (Qo; Qo: ф) и ἘΞ изоморфно as относительно 
тройки (Ωι, ΩΙ, np). Пусть Oo = ON Qh, Qo = Q_ ere 0. = pQo, и 

пусть ф2 и tp. являются сужениями отображений ф и ψ на о, 


и-Оосоответственно. Нетрудно показать, что преобразование 7 


5* 
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изоморфно е относительно тройки _ (Ω», Ω,, φο) и Τ μ80- 
морфно 7” относительно тройки (Q,, Q5, \p,). Так как образ 
множества ©. при отображении My совпадает с множеством Ω,, 
на котором определено отображение φο, TO с помощью KOM- 


позиции фо и \ можно получить и. однозначное ото- 
“ Fe ξ 
бражение ἕξ множества ©, Ha Ως: --ψο(φο(ω)). Теперь 


нетрудно убедиться, что Т и τ’ fag ek относительно 
> / 
тройки (Qo, Qo, =). 


Замечание 4. Если преобразование Т изоморфно Т 
относительно тройки (Q,, Q, φ), то в силу соотношений (5.1) 


и (5.2) 
| Get ol Qe... ther he TOD Te >. {55} 
И | 
ὦ) < TG, СБ, =. On 5. T0929 T° Oy Dk .). (5.6) 
Далее, из (5.3) следует по индукции, что если © & Q), то 

| ФТ” = Т"фо (5.7) 


выполняется при всех п >> 0. (В частности, Т”и γη изоморфны 
при всех и.) Наконец, из соотношений (5.5), (5.6) и (5.7) сле- 


дует, что если Аи В- множества из поля οἵ и если 


A=91(Q,N A), B= (ПВ), (5.8) 
TO 
| АЙПТ"В=фФ (QNANT"B), "0, (5.9) 
‘откуда. а 
Р(АПТ"В)=Б(АПТ”"В), (5.10) 


ибо множества Ωρ и ©, имеют меру 1. 


Замечание 5. Обратимые изоморфные преобразова- 
НИЯ Ἔ и T фактически изоморфны относительно тройки 
(Q,, Qo, $), обладающей тем специальным свойством, что 
множества О и О. строго инвариантны: 9 =тТ'©, и 

со 


О, =T'Q, (если это необходимо, заменим на Г Е 


n=-—co 


i | 
~ mn ~~ 
и Q) на [) Τ΄Ώ). Однако, вообще говоря, это не справед- 
п= — 00 


JIMBO: возьмем, например, в качестве @ пространство, со- 
стоящее из одной точки, а в качестве преобразования Т 
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<a 


односторонний сдвиг, при котором вся масса сосредоточена 
в, некоторой точке вида (i, i, i, ...). 

_ Различные пары преобразований, которые мы обсуждали 
в начале этого параграфа, изоморфны в смысле нашего 
определения. Рассмотрим еще несколько таких пар. 


< 


Пример 5.1. Преобразуем единичный квадрат О, 
удваивая каждую координату по оси X и вдвое уменьшая 
каждую координату по оси у. Преобразованный квадрат 
состоит из прямоугольников В и С (рис. 2). Переведем 


теперь прямоугольник С в прямоугольник А с помощью 
сдвига. Мы определили таким образом некоторое преобра- 
зование Т, переводящее пространство © в себя и сохра- 
няющее меру Лебега. Это преобразование называют преоб- 
разованием пекаря. Между преобразованием Т и сдвигом 
Бернулли (1/2, 1/2)') существует изоморфизм, Sep eae 
мый посредством соответствия 


(25 y) = (0, ΧιΧον «2 os 0, И, .. jt ey Yo, Ут» Ni, №, os ;) 
где 0, χιχο... "0, иу.... — двоичное разложение чисел х и у. 


Пример 5.2. Пусть преобразование Т — сдвиг Маркова 
с пространством состояний о, стационарными вероятно- 
стями р; и вероятностями перехода р:;. Тогда преобразо- 
вание Т? изоморфно сдвигу Маркова Т с пространством 
состояний р = 0”, стационарными вероятностями регу) = рр; 


и вероятностями перехода р лвр=рирРы. Если 9 [9] — 


пространство бесконечных в обе стороны последовательно- 
стей элементов пространства р [6], a xX, [¥,] — координатные 


переменные, TO нужно только положить =, QO, =a И 


1) Под сдвигом Бернулли (Pi, .... Dr) понимают сдвиг с вероятно- 
стями р, на пространстве состояний р. Природа элементов пространства р 


совершенно безразлична; вектор вероятностей записывают символом 
(р:,..., Pr), хотя пространство р может и не состоять из первых г целых 
чисел. Везде далее, если не оговорено противное, все сдвиги будем 
считать двусторонними, 


70 ГЛ. 2. ЭНТРОПИЯ 


определить отображение ф при помощи равенства Х, (фо) = 
= (Xon(@), Xon+1 (6) ). 


Пример 5.3. Если в качестве стационарных вероятно- 
стей и вероятностей перехода, соответствующих преобразо- 


ванию Т из предыдущего примера, взять соответственно 
Pci.) = PiPiy и Ра, р(в.0 =SjePer то преобразование Т будет 
изоморфно самому преобразованию Т. Мы снова полагаем 


Q, = 2, но Q, определяем на этот раз как множество точек ὦ, 
для которых вторая компонента координаты X,(@) совпа- 
дает с первой компонентой координаты Х„.:(&) при всех п, 
а отображение ф определяем соотношением Х, (фо) = 


= (Хи (6), Xn (ω) ). 


Пример 5.4. Пусть преобразование TJ — двусторонний 
сдвиг с пространством состояний р = {0, 1}; предположим, 
что наша мера Р такова, что не существует точечных масс. 


Пусть © пространство бесконечных в обе стороны последо- 
вательностей действительных чисел, как в примере 1.7. 
Пусть образ ‘фо элемента ὦ пространства ® является точ- 


кой пространства ©, Π-5 координата которой есть 

fe | 

ee ee (o)/2**! = 0, x,(@)X,-;(@) ... (двоичное разложение). 
k=0 | 


Тогда сдвиг Т изоморфен сдвигу Т, определенному на про- 
странстве Q с мерой Р=Рф"!. Можно показать, что в про- 
странстве @ координатные переменные {X,} образуют отно- 


сительно меры Р марковский процесс с единичным интер- 

валом в качестве пространства состояний. | 
Следующий пример показывает, что наше определение 

изоморфизма все еще не вполне удовлетворительно. 


Пример 5.5. Сравним тождественное преобразование 7, 
определенное на пространстве ©, состоящем из одной точки, 


с тождественным преобразованием Т на пространстве ©, co- 
стоящем из двух точек, причем поле οἵ содержит только 
пустое множество и само пространство ©. Хотя преобразо- 
вания Г и Τ᾽ неизоморфны, они имеют по существу одина- 
ковую структуру, ибо поле ‹Я таково, что у нас нет воз- 


можности различать две точки пространства Q. 

Этот пример характеризует некоторую трудность, которую. 
можно обойти, заменяя понятие изоморфизма понятием со- 
пряженности, Грубо говоря, на этом пути игнорируют в зна- 
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чительной степени точки и точечные преобразования и имеют. 
дело с множествами и преобразованиями множеств, для 
которых формулируют соответствующие понятия одинако- 
вости. Два преобразования, совпадающие в смысле этой 
теории, называют сопряженными. 

Вопрос состоит в том, какое понятие одинаковости при- 


нять. Преобразования ТГ и Т примера 5.5 удовлетворяют 
определению сопряженности. Тот факт, что эти преобразо- 
вания неизоморфны, можно приписать дефекту вероятност- 


ного пространства (О, ¥, P), на котором определено пре- 


образование Т. Понятия изоморфизма и сопряженности 
совпадают для большинства естественных пространств; так 
как эти понятия совпадают и для всех специфических про- 
странств, встречающихся в этой книге в связи с примерами. 
(за исключением только что рассмотренного), то мы выберем 
изоморфизм в качестве нашего понятия одинаковости со- 
храняющих меру преобразований. Однако дальше в этом 
параграфе мы все же определим понятие сопряженности и 
докажем, что оно действительно совпадает с понятием изо- 
морфизма для преобразований, определенных на некотором 
классе пространств, достаточно широком, чтобы включать 
в себя все те конкретные пространства, к которым мы при- 
меняем наши общие результаты. 


Инварианты 


Так же как можно задаться вопросом, являются ли 
знакопеременная группа из пяти букв и группа симметрий 
икосаэдра различными конкретными представлениями одной 
“HW той же алгебраической структуры — т. е, являются ли они 
изоморфными в смысле теории групп (а это так и есть), — 
можно задать вопрос, являются ли два конкретных сохра- 
няющих меру преобразования абстрактно одинаковыми 
в смысле принятого определения изоморфизма. Например, 
изоморфен ли сдвиг Бернулли (1/2, 1/2) сдвигу Бернулли 
(1/3, 1/8, 1/3)? 

Для доказательства изоморфности двух преобразований 
нужно построить соответствующую тройку (%, 9%, φ). Для 
доказательства неизоморфности двух преобразований нужно 
отвергнуть — предпочтительно одновременно — все возможные. 
варианты выбора тройки (00, Ωρ, φ). Следующее рассужде- 
ние показывает, что так же как две группы не могут быть 
изоморфными, если одна из них коммутативна, а другая 
нет, так и два сохраняющих меру преобразования не могут 
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быть изоморфными, если одно из них обладаег свойством 
перемешивания, а другое этим свойством не обладает. 


Предположим, что Т иТ изоморфны относительно тройки 
(Ωρ, Qo, φ) и Т обладает свойством перемешивания; мы 


должны доказать, что тогца Т также необходимо обладает 
этим свойством. Для того чтобы уловить основной момент 


рассуждения, предположим сначала, чго 9 =@ и %=0 


(Tak что преобразования Г и Т изоморфны в смысле пред- 
варительного суженного определения). Мы имеем тогда для 


‘любых множеств Аи В поля ¥ (см. (5.4)) 
P(ANT"B)=P(g'ANg@ T"B)= 
=P(p АПТ" BB) P (pA) P(g В)=Р(А)Р(В), 


где использовано свойство перемешивания преобразования Г. 


Таким образом, преобразование Г перемешивающее. 
Некоторое изменение этого доказательства покрывает 


общий случай, когда не предполагается, что Ορ =© и QO, = О. 
Для множеств Α и В поля «Я положим A= po (ПА) И 
B= 97(Q,N 8B); в силу (5.10) имеем 


Б(АПГ-"В) = Р(АПТ"В)>Р(АДР(В)=Р(АР(В. 


Итак, свойство перемешивания является инвариантом: 
если одно из пары сохраняющих меру преобразований обла- 
дает этим свойством, то и другое им обладает. Используя 
этот инвариант, убеждаемся, что сдвиг Бернулли не может 
быть изоморфен вращению окружности или сдвигу Маркова 
с периодической матрицей вероятностей перехода. 

Другим инвариантом является эргодичность (нужно за- 
менить в приведенном доказательстве обычные пределы пре- 
делами по Чезаро и применить теорему 1.4). Поэтому, на- 
пример, сдвиг Маркова с приводимой матрицей вероятно- 
стей перехода не может быть изоморфен никакому сдвигу 
Маркова с неприводимой матрицей '). 

Обратимость не является вполне инвариантным свойством: 
изменим обратимое преобразование, отображая все точки 
некоторого множества меры 0 в одну и ту же точку. Если, 
однако, преобразование Т изоморфно некоторому обра- 


1) Инвариантом более мощным, чем перемешивание и эргодичность, 
является спектральная структура изометрического оператора, порожден- 
ного преобразованием ТГ. Этот инвариант будет рассмотрен в конце на- 
стоящего параграфа. 
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тимому преобразованию Т, то Т взаимно однозначно на 
некотором подмножестве ©, меры 1. Отсюда следует, что 
двусторонний сдвиг не может быть изоморфен односторон- 
нему, если только вся мера, отвечающая последнему, не 
сосредоточена в точках вида (i, i, i, ...). Вообще говоря, 
можно сформулировать инвариантное определение обрати- 
мости, но мы не станем этого делать. | 

Чем больше структур различает инвариант, тем он по- 
лезнее; лучше всего, если он полный. Размерность является 
полным инвариантом в векторных пространствах (скажем, 
вещественных) в том смысле, что два векторных простран- 
ства одинаковой размерности необходимо изоморфны. Эрго- 
дичность. не является полным инвариантом для сохраняю- 
щих меру преобразований: очевидно, что существуют не- 
изоморфные пары преобразований, каждое из которых 
эргодично (или оба не эргодичны). Свойство перемешивания 
также не является полным инвариантом. 

Вернемся к вопросу об изоморфизме сдвигов Бернулли 
(1/2, 1/2) и (1/3, 1/3, 1/3). Эргодичность и перемешивание не 
являются, разумеется, инвариантами достаточно сильными, 
чтобы различать эти сдвиги, ибо оба сдвига перемешивающие 
и, следовательно, эргодические. Вопрос о том, изоморфны ли 
эти два сдвига, много лет не поддавался решению. Наконец 
Колмогоров разрешил эту проблему в отрицательном смысле, 
введя новый численный инвариант — энтропию сохраняющего 
меру преобразования. Оказалось, что сдвиги Бернулли 
(1/2, 1/2) и (1/3, 1/3, 1/3) имеют различные энтропии и потому 
неизоморфны. Инвариант Колмогорова — это существенным 
образом измененное понятие энтропии, введенное ранее 
Шенноном в теории информации. Здесь мы нарушим исто- 
рическую последовательность. В этой главе мы изучим де- 
тально инвариант Колмогорова, а позднее применим полу- 
ченные результаты к теории информации. 


Энтропия 


Нам потребуется несколько определений, которые мы 
дадим сначала формально, отложив мотивировку на даль-_ 
нейшее. Везде далее мы будем обозначать буквами A, ® 
и © конечные подполя поля οἵ. (Конечное подполе авто- 
матически является о-полем.) Если {A;,..., A,} есть с -раз- 
биение пространства ®, т. 6. конечная совокупность непе- 
ресекающихся непустых элементов поля οἵ, объединение 
которых совпадает со всем пространством ©, то класс всех 
конечных объединений элементов этого разбиения является 
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конечным подполем поля οἵ. Легко видеть, что и обратно, 
любое конечное подполе получается таким образом из не- 
которого οὗ -разбиения. Элементы такого разбиения будут 
называться атомами соответствующего конечного поля: 
Между οἵ -разбиениями и конечными. подполями поля oF 
существует полная двойственность. Например, «ἐς F в том 
и только том случае, если разбиение, соответствующее ко- 
нечному подполю F, мельче, чем разбиение, соответствую- 
щее o£, в TOM смысле, что каждый атом подполя ‹ является 
объединением атомов подполя F. 

Для любой совокупности множеств 6’ можно записать 
T° ={|T°E: ESE); если @-— поле (или о-поле, или ко- 
нечное поле, или οἵ -разбиение), то то же самое справедливо 
и по отношению к Т"®. Если преобразование Т обратимо, 
это же верно и для ТГ"б ={Т"Е: ESS}. Если ἕῳ «EG A,— 
произвольные совокупности множеств, то символом We 

aca 
будем обозначать с-поле, порожденное объединением U ба 
| aca 


п 
в конечном случае будем ‘писать \/ @; =&\... уз. 
= ae 


Если 4 и # — конечные поля, то ἐν ® —также конечное 
поле. В самом деле, атомы поля ον ® являются по пре- 
дыдущему (непустыми) пересечениями ДП В атомоз А поля 4 
и атомов В поля FB. 


η {1} 


0 ] 
Puc. 8. 


Далее во всей книге будем обозначать символом 1(f) 
функцию, определенную на единичном интервале формулой 


в если 0<Е<1, 
п = 0=010, если 1-0. 


Мы постоянно будем использовать основные свойства функ- 
ции 1: она неотрицательна, непрерывна, строго выпукла и 


п(0)=п(1)=0 (рис. 3); 


(5.11) 
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Энтропия преобразования Т определяется в три шага. 
Энтропия конечного поля A определяется формулой 


Н (ο) = 2 η(Ρ (Α)) = — pa P(A) 15 P(A), (5.12) 


где суммирование производится по атомам А поля οἵ. 
Энтропия конечного поля cf относительно преобразова- 
ния Т есть 


h(A, T)= lim — L(V ra), (5.13) 

n->oo : 
(Оказывается, что верхний предел в этом выражении COB- 
падает с обычным пределом.) Наконец, энтропия преобра- 
зования 7 задается выражением 


h(T)=suph(A, Т), Ш. 


где верхняя грань берется по всем конечным подполям «6. 
ποπη oF 

Для понимания интуитивных идей, лежащих в основе 
этих определений, рассмотрим кость с г гранями. В каче- 
стве меры количества случайности при однократном бро- 
сании этой кости возьмем неотрицательную величину 


Zn(e)=— 2 pila ps (5.15) 
где Pjy «+5, р, — вероятности, соответствующие различным 


граням кости. Здесь мы не будем углубляться в подробно- 
сти, но, вообще говоря, можно вывести (5.15) из некоторой 
системы аксиом, которым должна была бы удовлетворять 
мера случайности. Заметим, что выражение (5.15) достигает 
максимума (равного Inr) в том и только том случае, если ') 
каждая вероятность р; равна l/r; подобная ‘кость интуи- 
тивно представляется „наиболее случайной“. Другого экстре- 
мума — нуля — выражение (5.15) достигает в том и только том 
случае, когда одна из вероятностей р; равна 1, а другие 0; 
_ такая ‘кость — „наименее случайная“. 

В любом случае мы рассматриваем выражение (5.15) как 
меру количества случайности в эксперименте, состоящем 
в однократном бросании нашей кости, и называем его энтропией 


r 
1) Функция Σ η (pit 12) имеет отрицательную вторую производную 
=! 
по действительной переменной #; следовательно, (5.15) есть строго выпу- 
клая функция вектора вероятностей Рек Dr). Максимум ее можно 
найти дифференцированием. 
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этого эксперимента. Эта величина измеряет также коли- 
чество неопределенности, содержащейся в этом экспе- 
рименте, т. е. количество неопределенности до бросания 
кости относительно того, каков будет его результат. Нако- 
нец, эта величина измеряет информацию, содержащуюся 
в этом эксперименте, или количество информации, полу- 
чаемой в результате бросания. Тот факт, что случайность 
и неопределенность имеют естественную общую меру, не- 
удивителен. Вследствие „формулы“ 


прирост информации. = устраненная неопределенность 


представляется разумным, что неопределенность и инфор- 
мация должны измеряться с помощью одной и той же 
функции. (Предполагается, что экспериментатор знает веро- 
ATHOCTH р;, но не знает заранее, какая грань выпадает при 
каждом отдельном бросании.) 

Конечное поле 4 играет роль эксперимента с конечным 
числом исходов. Богиня Тихе выбирает точку ® из про- 
странства ® в соответствии с вероятностной мерой P, но 
открывает экспериментатору только тот атом поля σ΄, ко- 
торый содержит точку ὦ. Атомы поля выступают в каче- 
стве исходов этого эксперимента, а выражение (5.12) изме- 
ряет информацию (а также неопределенность), в нем содер- 
жащуюся. 

Например, для того чтобы выбрать некоторую точку ὢ 
из пространства двенадцати точек 


(Г, OW, 2) (Г, 3) (Г, 4) (Г, 5) (Г, 6) 
`(Р, ПФ, 2) (Р, 3)(P, 4)(P, 5)(P, 6), 


Тихе бросает монету со сторонами Г иР и кость с rpa- 
Hamu 1, 2, 3, 4, 5, 6. Если нам известен лишь результат 
бросания монеты, то мы знаем только, из какой строки 
выбрана точка ©; эти две строки являются атомами конеч- 
ного поля, формально представляющего эксперимент, со- 
стоящий в бросании монеты. Энтропия этого конечного 
поля не зависит от индивидуальных вероятностей данных 
двенадцати точек; она зависит только от вероятностей двух 
указанных атомов. 

Так как атомы поля AV # представляют собой пере- 
сечения атомов поля ‹ и поля F, то, если нам известно, 
какой атом поля «έν ® содержит точку ®, то тем самым 
мы знаем, какой атом поля «и какой атом поля  со- 
держат ὦ. Таким образом, поле & V ®, рассматриваемое 
как эксперимент, является соединением экспериментов, 
соответствующих полям и Φ, 
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mt 
Если Т— сохраняющее меру преобразование, To T A— 
конечное поле с тем же числом атомов, что и поле A, и 
соответствующие атомы имеют равные вероятности. Так как 


поля αἱ и Т cé имеют одинаковую вероятностную струк- 
туру, то их можно считать реализациями одного и того же 
эксперимента. Отметим, что эти реализации не обязательно 
независимы; знание того, что точка ® лежит в некотором 
определенном атоме поля ο, может помочь эксперимента- 


5» —1 
тору определить, какой атом поля Τ᾽ οί ее содержит (т. е. 
какой атом поля A содержит точку То). Будем рассматри- 


вать поля ο и T A как реализации эксперимента, совер- 

шающиеся в последовательные моменты времени (скажем, 

в следующие друг за другом дни), и такое представление 

мы сохраним даже и в случае, когда преобразование Т не 
является сдвигом. , 
ape 

В этой интерпретации конечное поле Ут" соответ- 


ствует сложному эксперименту, состоящему из И реализа- 


» vad ft) 
ций A, T'A,..., T "A эксперимента, соответствующего 
полю A. Для того чтобы получить информацию, прихо- 
дящуюся на одну реализацию эксперимента, разделим на п 


п-1 | 
-& 
количество информации Н № Г α сложного эксперимента. 
k=0 


; n—-1 
При п-> © информация „тн (У ra), приходящаяся на 
k=0 


одну ‘реализацию, стремится (как мы увидим) к пределу 
h(A, Т), который мы рассматриваем как среднюю скорость 
создания информации при большом числе реализаций экс- 
перимента ο΄. Функция A(T) есть верхняя грань этих ско- 
ростей по всем экспериментам ο΄. 

Рассмотрим в качестве специального случая сдвиг. Пусть 
пространство состояний р есть некоторый алфавит, а коор- 
динатные переменные X, — буквы этого алфавита, последо- 
вательно доставляемые некоторым источником информации. 
В английском языке буква E встречается значительно чаще, 
чем О, как это известно всем, включая изобретателя азбуки 
Морзе, который обозначил. букву Е символом +, а О сим- 
волом ——.—. Если развивать далее эту идею, то она 
приведет к плодотворной точке зрения, согласно которой 
английский текст можно воспроизвести с помошью вероят- 
ностного механизма. Сдвиг дает подходящую математиче- 
скую модель, в которой мера Р описывает структуру языка. 


78 ГЛ. 2. ЭНТРОПИЯ 


Пусть теперь v€— конечное поле с атомами {@: ху (®) = ἢ), 
где i пробегает алфавит 0. Это поле, которое мы будем 
называть полем событий, наблюдавшихся в момент вре- 
мени 0, ибо оно определяет букву, полученную в момент 


времени 0, имеет энтропию >) η(Ρ {Χο-- δ), измеряющую 
i=p : 


количество информации, доставляемой источником при со- 
здании им одной отдельной буквы. Tak как Τ᾽. "(xo =i} = {<<< i}, 
п-| 
_Ё < 
то атомами поля \/ Г" являются г" множеств {ж=й, ... 
k=0 


..., Xp) =i,-1}. Таким образом, 


1 в -Ё 1 : ; 
ΗΝ T*Al=— У π(ρ(οτίν..., taf) (6516) 
~ fag te ns 
есть информация, приходящаяся на букву в сообщении 
длины n. Предел й(%, Г) есть информационная скорость 
источника 1). 

Если Т-—сдвиг Бернулли (ру, ..., ‚ Pr)» то простые вычи- 
сления преобразуют (5.16) в 


+ p> (P:Pi, nats = : 2 pi ln pis 


10+ ἱῃ-1 


так что источник, последовательно доставляющий буквы 
независимым образом, имеет информационную скорость 


h(A, Т)=- Хр Шри. 


» 


Заметим, что эта скорость наибольшая, когда все веро-. 
ятности р;, соответствующие различным буквам, равны 1/;, 
т. е. когда мы находимся в „чисто случайной“ ситуации, 
что кажется сначала парадоксальным. Но чем ближе источ- 
ник К чисто случайному, тем менее он стереотипен и, следо- 
вательно, более информативен. Несущественно, что именно 
создает источник информации, важно только, насколько 
предсказуемо то, что он создает. 

Возвращаясь к математике, покажем, что энтропия ин- 
вариантна по отношению к изоморфизму. Пусть Т изо- 


1) Это определение Шеннона. Идея Колмогорова состояла в изуче- 
нии функции A(T), которая определена для любого преобразования Τ 
(а не только для сдвигов) и используется в эргодической теории. 
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~ 


морфно Т относительно тройки (9, Ωρ, φ), где для простоты 


мы сначала предположим, что 9 =@ и О, =®9. Тогда каж- 
дому конечному подполю «6 поля οἵ соответствует неко- 


торое конечное подполе A=oA ={@A: A & 4} поля $, И 
обратно. Так как отображение ф переводит меру Р в P, то 


H(A)=H (A). Если конечные подполя ‹ и A поставлены 
друг другу. Β а а то в силу (5.4) друг другу соот- 


ветствуют ν T"A и ν ἘΞ Ρα. и, следовательно, в силу (5.13) 


имеем atch, т) = nl. Г). Таким образом, для каждого под- 
поля A существует такое подполе σ΄, что № (Я, T)= h(A, T), 


и обратно. Взяв верхнюю грань, видим, что A(T)=h(7). 
Если не делать специального предположения, что 6% = 


и Q,=Q, то потребуется несколько более сложное рассуж- 
дение. Так как изоморфизм — отношение симметричное, то 


достаточно доказать, что h (T)<A(T). Пусть A -— некоторое 


конечное подполе поля οἵ с атомами A;,..., А,. Положим 
А; =ф1 (0 ПА), i=1,..., 7, и пусть %-— такое конечное 
подполе поля οἵ, которое имеет своими атомами г-+1 
множество Αι, ..., А,, Ωρ. Используя обобщение формулы 


(5.10), получаем 
п п-1 
т #)- (> ptf ))- 
lV, : τ iy a4 es | 
п-—1| 
-.3. (fins) 
iy κὰν in-| k=0 | 


Эта последняя сумма распространяется на все атомы 
.ᾱ-| 


=k , 
ν TA, за исключением тех, которые содержат множитель 
k=0 | 


п-| п! 
Т "05, имеющий меру 0. Поэтому H № гл) - ην Е ма). 


так что h(A, Τὴ =h(A, Г). Неравенство. h(A, = A(T) 
выполняется для любого конечного поля Я, следовательно 
h(T) Sh (7). 

- Итак, изоморфизм сохраняет энтропию. Отметим здесь, 
что энтропия не является полным инвариантом. Если Т, — 
циклическая перестановка А точек равной массы (0-поле 
состоит из всех подмножеств этого пространства), то й (Т,) =0 
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для всех К, хотя очевидно, что перестановки Т, для раз- 
личных Е неизоморфны. 

Очень важно понимать, в ‘чем состоит различие между 
функциями h(A, Т) и A(T) и зачем последняя вводится. 
Если в качестве энтропии преобразования Т взята функ- 
ция A(#A, Т) для некоторого „естественно“ выбранного 
подполя <4, например в случае сдвига для поля событий, 
наблюдавшихся в момент времени 0, то вследствие неинва- 
риантного определения она может оказаться бесполезной 
для проблемы изоморфизма. Мы определяем A(T) как верх- 
нюю грань для h(#, Т) именно для того, чтобы сделать 
энтропию инвариантной. Но тогда возникает вопрос, как 
ее вычислять. Мы вычислили, например, A(4, T) для сдвига 
Бернулли и для поля событий, наблюдавшихся в. момент 
времени 0, но возможно, что некоторая Й (4%, Т) превосхо- 
дит h(A, Г). Если мы пожелаем вычислить энтропию самого 
сдвига Бернулли, потребуется нечто иное. 

Колмогоров получил важный результат, который 
мы сейчас используем: если Т обратимо и %- такое 


со 


конечное поле, что!) \/ T*#=F, το h(T)=h(A, 7). 


n=— oc 
Предполагая справедливость этой теоремы, которую вместе 
с ее вариантами мы докажем в § 7, можно вычислить 
энтропию сдвига Бернулли. В самом деле, если — поле 
событий, наблюдавшихся в момент времени 0, то поле 


\/ T°A содержит все множества вида T"{x,=i)}={x,=3, 


п=- 0 
следовательно, все цилиндры, и должно, таким образом, 
совпадать с о-полем, порожденным этими цилиндрами. 


Следовательно, h(T)=h(A, T)=— У р, пр, что является 
7 


не определением, а следствием нашей теории. В частности, 
сдвиги Бернулли (1/2, 1/2) и (1/3, 113, 1/3) имеют энтропии 
ш2 и In3 соответственно и, следовательно, неизоморфны. 

Энтропия является, таким образом, инвариантом доста- 
точно сильным, чтобы решить поставленную раньше задачу. 
Теперь стала ясна и наша программа. Мы должны вывести 
свойства функций Н ($), h(A, Т) и A(T), достаточные для 


со 


!) Напомним, что \/ ΤΊσξ есть о-поле, порожденное объединением 


i =— 00 
co 


U ree. 


n=—00 


5. ПРОБЛЕМА ИЗОМОРФИЗМА 81 


того, чтобы доказать результат Колмогорова, который зани- 
мает центральное место во всей этой теории. 

С проблемой изоморфизма тесно связана теория кодиро- 
вания, изложенная в гл. 5. Многие результаты настоящей 
главы находят там дальнейшее применение. 


Изоморфизм и сопряженность * 


Предположим, что преобразование Т изоморфно Т отно- 


сительно тройки (Q), Q), $). Можно использовать этот изо- 
морфизм для того, чтобы сопоставить множества поля οὔ. 


и множества поля οἵ следующим образом. 
Будем называть множества А и В поля οἵ эквивалент- 
ными и писать A~B всякий раз, когда Р(А- В) =0; το же 


относится и к множествам поля ‹Я. Это понятие эквива- 
лентности рефлексивно, симметрично и транзитивно. Пусть 


А-— множество поля cf и А- множество поля οἵ ; будем 
сопоставлять их друг другу всякий раз, когда. существуют 


такие множества A, u Αμ, принадлежащие полям οἵ и Я 
соответственно, что A, <Q), Ay <Q, A~ Ap, A~ A, u Ay = фо. 
Такого рода сопоставление множеств A и А (τ. е. существо- 
вание указанных множеств Ay и Ao) МЫ Ум обозначать 


А— А. 
Это сопоставление является многозначным соответствием 


между полями «Я и «Я. Легко убедиться, Что это соответ- 
ствие обладает следующими свойствами. (Далее все множе- 
ства предполагаются принадлежащими полю οἵ или 


полю αἵ) 


(С!) Для любого множества А существует по крайней 
мере одно множество А такое, что А<>А; для любого 
множества А существует по крайней мере одно множество А 
такое, что A<>A,. 

(C,) Если А< А, то A<>B в TOM и только том случае, 


когда Aw~ В: если А< А, TO В <> Ав том и только том 
случае, к когда А— В 


(C,) Если А<Д, то Q—A<>Q—A; если АА где 


множество индексов конечно или счетно, TO Ил, = (0 А». 
1 п 


(Cy) Если А <> А, το P(A\=P(A). 
(С;) Если А<А, то Т'А<> ТА, 


6 Зак. 1491 
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Это соответствие есть взаимно однозначное соответствие 
между классами эквивалентных множеств (в силу (Οι) и (С.)). 
Оно сохраняет дополнения множеств и конечные или счет- 
ные их объединения (С.), сохраняет меру (С.) и замкнуто 
относительно операции обратного отображения (C;). 


Предположим теперь, что между полями οἵ и % 
a priori существует некоторое многозначное соответствие, 
удовлетворяющее этим пяти условиям. Тогда говорят, что 
Ри т сопряжены '). Сопряженность, очевидно, является 
отношением эквивалентности. 

Соответствие, определяющее сопряженность, автомати- 
чески обладает еще рядом свойств, кроме свойств (С!) — (С,). 
Из свойства (С.) следует, что это соответствие сохраняет 
все конечные и счетные теоретико-множественные операции 
(например, разности, симметрические разности, конечные и 


счетные пересечения). Далее, пусть Т ΓΑ-» TA; в силу (Οἱ 
существует такое множество В, что A<>B; из (Cz) следует 
T A<>T''B, так что в силу (Co) PAST В и, следова- 
тельно 3), A~B, а тогда A<>A. Таким образом, 


(Cy) если ΓΓΑ «»1ΤΓΙΑ͂, то AA. 


Если преобразования Т и Т обратимы, TO из свойств 
(Cs) и (60) следует, что А<Ав том и только том случае, 
когда ТА <= ТА. 


Мы видим, что если Ти Т изоморфны, то они сопря- 
жены. Пример 5.5 показывает, что обратное предложение, 
вообще говоря, неверно. Мы докажем, что такое обраще- 
ние справедливо при дополнительных предположениях, что 


О иО-— сепарабельные полные метрические пространства, 
‚а <Я и οἵ являются о-полями борелевских множеств этих 


пространств (т. е. οἵ и οἵ —это о-поля, порожденные от- 
крытыми множествами, или, что то же самое в силу пред- 


положения сепарабельности, «Я и «Я —это о-поля, поро- 
жденные шарами). 


Ὁ) Такая формулировка устраняет необходимость введения алгебр 
с мерой. В терминах алгебр с мерой А-В в том и только том случае, 
если A+B принадлежит идеалу № нульмерных множеств и вышеупомя-_ 
нутое соответствие существует в том и только том случае, если фактор- 


алгебры ¢-/N и ¥/N и преобразования на них абстрактно тождественны. 
2) Заметим, что А ~ BB том и только том случае, когда ΤΑ οΤΓΙΒ 
(аналогично для множеств пространства (9). 
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Все конкретные пространства (©, «Я#), встречавшиеся 
нам в различных примерах, можно было бы определить 
в топологических терминах, но мы этого не делали. Если 
О — окружность, т. е. пространство, на котором определены 
‘вращения (пример 1.5), то оно имеет естественную метрику, 
относительно которой является сепарабельным полным ме- 
трическим пространством, а именно расстояние между двумя 
точками измеряется длиной кратчайшей дуги, их соединяю- 
щей; так как шарами здесь являются дуги, то соответст- 
вующее о-поле ef состоит из борелевских множеств в этой 
метрике. 

Некоторые преобразования (преобразование, связанное 
с непрерывными дробями, и различные преобразования 
То =го (mod 1)) были определены на полуоткрытом единич- 
‘ном интервале © = [0, 1). В этом случае о-поле состоит 
из обычных линейных борелевских подмножеств полуинтер- 
вала [0, 1); это — о-поле, порожденное открытыми подмно- 
жествами полуинтервала [0, 1) с евклидовой метрикой. От- 
носительно этой метрики пространство Y сепарабельно, HO 
неполно; так как полуинтервал [0, 1) гомеоморфен лучу 
[0, 1) в евклидовой метрике, TO Q может быть вновь метри- 
зовано так, чтобы быть не только сепарабельным, но и 
ПОЛНЫМ. 

Мы рассматривали также преобразования на конечном 
пространстве © с классом всех его подмножеств в-качестве 
ПОЛЯ οἵ . Здесь нам требовалась только дискретная метрика 
в О, скажем, такая, при которой расстояние между раз- 


‘личными точками равно 1. (Ср. с пространством @ при- 
мера 5.5, где οἵ слишком мало.) 


В пространстве {ὁ = XOXOXOX... двустороннего 
сдвига о-поле Я порождено тонкими цилиндрами 
{o: x1 (6) = ip uS1S 53). Е 


Если расстояние между двумя точками © и ©’ определяется 
как 
5 ὃ (Xn (@), Xn (@’) ) 
BS Ел? 
n=—o 
где 6(i, |) равняется | или 0 в зависимости от того, сов- 
падают элементы Ги] пространства состояний р или нет, 
TO Q является сепарабельным полным метрическим про- 
странством. Если точка ® принадлежит цилиндру (5.17) и 
+ 

0<=< (1,)!""*"°', то открытый шар радиуса = с центром 
в точке ® содержится в цилиндре (5.17). С рой стороны, 


6* 
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если — и=о > 0: (ο) <= ий=х, (®9) для | [|< 9, то точка Wo 


принадлежит цилиндру (5.17), который в свою очередь 
содержится в открытом шаре радиуса в с центром в в. 
Таким образом, тонкие цилиндры образуют базис в этой 
топологии, и в ней поле οἵ совпадает с классом борелевских 
множеств. Подобным образом можно рассматривать и одно- 
стороннее прямое произведение 9 XOX... 

Можно также показать '), что топологическое произве- 
дение бесконечной в обе стороны последовательности экзем- 
пляров любого сепарабельного полного метрического про-. 
странства может быть метризовано так, что оно станет 
сепарабельным полным пространством (пример 1.7). 
| Следующая теорема оправдывает выбор изоморфизма 
в качестве нашего понятия одинаковости сохраняющих меру 
преобразований. 


Теорема 5.1. Пусть T и Т- сохраняющие меру `пре- 
образования на (Q, <Я, Р) и (0, &, Р) соответственно, где 
О и Q — сепарабельные полные метрические пространства, 
а <Я u --9το о-поля _борелевских множеств этих двух 
пространств. Если Ти я сопряжены, то они изоморфны. 


Для доказательства нам понадобятся три леммы, рота: 
навливающие связь меры с топологией. 


Лемма 1. Для любого множества А из поля F и 
любого 8» 0 существуют замкнутое множество Е и открытое 
‘множество G, такие, что FE ACG и P(G—F)<e. 


Доказательство. Пусть #—класс множеств поля oF , 
обладающих указанным свойством. Достаточно показать, 
ЧТО & есть о-поле, содержащее открытые множества. Оче- 
видно, что класс & замкнут относительно взятия дополнения. 
Для заданных множеств A, из < выберем замкнутые мно- 
жества F, и открытые множества G,, такие, что F,CA,CG, 


и P(G,—F,)<e/2"!. Если F=(JF, И GELG,. TOCA = 
=J4.<G ua P(G—F)<e/2. Множество G открыто; мно- 


п > 
жество F не обязательно замкнуто, но его можно заменить. 
конечным, следовательно, замкнутым, подобъединением 


= [J Е» таким, что Ρ(Ε-- Po) <e/2. Отсюда следует, что 


NS Πο 


1) См., например, Данфорд и Шварц [1, стр. 44]. 


5. ПРОБЛЕМА ИЗОМОРФИЗМА 85 


А=. Итак, класс & есть о-поле. Так как & замкнуто от- 
носительно взятия дополнения, то доказательство будет 
завершено, если мы покажем, что Y содержит все замк- 
нутые множества A. Для такого А множество Gy, состоящее 
из всех открытых шаров радиуса 1/Е с центрами в точках 
‚из А, открыто и убывает к A; следовательно, мы можем 
взять А в качестве F и одно из множеств С, в качестве G. 


Лемма 2. Если AGF ue>O, то существует конечная 
или счетная совокупность попарно непересекающихся мно- 
жеств Ру, Е›,..., таких, что каждое ЁЕ„- замкнутое MHO- 


жество с диаметром, меньшим в, UF. ς- 47 
Ρ [ὁ —-U Fn) = 0. | 
п 


Доказательство. Шо лемме 1 А содержит такое _ 
замкнутое множество ΓΙ, что Р(А-— РЁ!) <1; А-Р, содержит 
такое замкнутое множество F,, что P((A— F,)— Е.) < 1/2; 
A—F,—F, содержит такое замкнутое множество Р., что 


1 
PALA RS (Fo) Ba) es 


и т. д. Построенные таким образом непересекающиеся замк- 
нутые множества удовлетворяют соотношениям Це =А И 


п 
и РЕВ 
п 

Далее, так как пространство © по предположению сепа- 
рабельно, то А является объединением счетного числа не- 
пересекающихся измеримых множеств Αρ, диаметры которых 
меньше 6. Аналогично строим для каждого А, последова- 
тельность множеств {ЁР,„}. Все эти множества в совокупности 
удовлетворяют требованиям леммы. 

Пусть & и © — два семейства попарно непересекающихся. 
множеств. Мы говорим, что © измельчает SY, если каждый 
элемент семейства © является подмножеством некоторого 
элемента семейства &. Из этого следует, что каждый эле- 
мент семейства © содержится POBHO B одном элементе 
семейства “, что если HE HWM, СеЕЗи HG #0, то HCG, 
и что объединение всех множеств из © содержится в объ- 
единении всех множеств из &. Такие семейства являются 
разбиениями объединений своих элементов. 


Лемма 3. Пусть @ |, 9.,...- разбиения пространства ® 
на такие конечные или счетные совокупности множеств из 
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поля οἵ , что каждый элемент разбиения ©’, имеет диаметр, 
меньший Εμ, где г, ->0. Toeda 08, порождает of Ilycro «δι 


‘состоит из конечных и счетных объединений элёментов раз- 
биения ©’,; если Oni, измельчает Gy для каждого п, то 


= 9,<... и (PF, есть поле, порождающее F . 


tt 


Доказательство. Для любого заданного замкнутого 
множества Ё обозначим через A, объединение тех элементов 
разбиения @,, которые пересекаются с F. Тогда FCA, и 
любая точка из A, удалена не больше, чем на в, от неко- 
торой точки множества F. Так как F замкнуто, отсюда сле- 


дует, что к [Аа Поэтому 0-поле, порожденное 0=.. 


содержит все замкнутые множества и, следовательно, сов-. 
падает с cf . Остальное тривиально. 


OTH три леммы, разумеется, справедливы и по отноше- 
нию к пространству (Ω, ¥, Р). 


Предположим теперь, что Ги T сопряжены относительно 
некоторого соответствия, удовлетворяющего ~ условиям 


(C,)—(C;). Для того чтобы доказать, что Ги Т изоморфны, 
построим сначала две последовательности © 


δι, Go, eee 
See Fee 


классов CO следующими свойствами. 

(п) Класс 9, [#] есть (непустое) конечное или счетное 
семейство попарно непересекающихся множеств из F [9 |. 
Все элементы класса ©, [,,] имеют положительную Р-меру 
[Р-меру] и, следовательно, не пусты. 

(п) Семейство 9,1 [„+!| измельчает семейства Ὁ, [%,] и 
Е oe 

(л.) Для нечетных п [для четных и] множества из 9’, [2] 


замкнуты и имеют диаметры, меньшие I/n. 
(ла) Существует взаимно однозначное отображение © n 


Ha τ обладающее тем свойством, что если С- любой 
элемент класса Я, и С — его`образ в ο относительно этого 
отображения, то Gee ie 

(πε) Если Q, Dyaee объединение всех элементов класса 
ΕΠΕ то Р (Q,) = ЦР (Q,) = 11. 
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Построим сначала @, и δι. В силу леммы 2 существует 
конечное или счетное семейство непересекающихся замкнутых 
множеств, объединение которых Q, таково, что P (Q))= 1, 
причем элементы этого семейства имеют днаметр, меньший 1. 
Пусть класс 8, состоит из тех элементов этого. семейства, 
которые имеют положительную меру. 

Если Οι, Co, ...— элементы класса ὅι, то, согласно усло- 


вию (C;), существуют такие множества Cj, Cs, ca aS 
что C, <>C,. Семейство множеств C,— () ἕῳ FRBSISEDO" 
ul’ zu 


ряет всем требованиям для Cz 
Предположим, что построены частичные последователь- 


НОСТИ 
©, © oy ee 99 © ns 
©, ὅ ο, ee eg м. 


Покажем, как построить классы 64; и δ). Возьмем сначала 
четное п (так что #+ 1 нечетно). 


Пусть Οι, С.,...- элементы класса Ὁ, Οι, Co, ... — эле- 
менты класса © ,,, упорядоченные таким образом, о С =>. 


В силу леммы 2 каждое множество С„= С, ПТ“ ‘С содер- 
жит попарно’ непересекающиеся множества Су, в woe 
замкнутые, имеющие диаметр, меньший 1/и +1), и такие; 


что Efe - UC) = 0. Обозначим через D,ow множества 


из oF такие, что Cuow +> Бо положим Eqoy = Daow CaN 
ΕΕ пусть Crow = ae UJ Exnow. Из свойств (C,)— (C;) 
w’ -- τῳ 


соответствия, определяющего сопряженность, следует, что 
семейство Я: состоящее из множеств С, и семёйство 


Gust, состоящее из множеств C,,», обладают всеми требуе- 
мыми свойствами, за исключением того, что некоторые мно- 
жества из этих семейств могут иметь меру 0. Выкинем все 
такие множества. 

Если nm нечетно (так что n+l четно), мы просто изме- 
ним порядок построения и будем строить сначала класс 


Ona, применяя лемму 2 к пространству ©, а затем с помо- 
щью отношения сопряженности класс @ p41. 
Это завершает построение последовательностей Е АЕ 


и, 9, .... Если 9 = По, и Ωρ = ΠΟ, το P(Q)=1 u 


n=! n=l 
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Р (0) =1. Мы определим отображение ф множества Ωρ на Qo, 
которое приведет к изоморфизму между преобразованиями 


иг. 

Будем называть цепочкой в Q последовательность мно- 
жеств (С, таких, что. С: >62 и бе Из того, 
что C, непусто, и из свойства (л.) следует, что пересечение 
множеств этой цепочки состоит из единственной точки, ле- 
жащей в ©. И обратно, любая точка из Q) определяет, 
таким образом, ровно одну цепочку. Все это справедливо | 


‚и для 0. | 
ὦ 3 ; - / 
Заменим класс @, семейством {СПО :СеЕб}=б, и 
класс @, семейством {СП%:Себ,}= ©„. Тогда цепочки 


все еще пересекаются в единственной точке H3 {2} или из 9, 
и условия (л,)— (πε) все еще сохраняются, за исключением 


того, что от класса @, при нечетном n и от класса ©, при 
четном п теперь не требуется, чтобы они состояли из замк- 
нутых множеств (это больше не имеет значения). Семейство 


~ 


/ / р 
$,|¢,| является теперь разбиением множества ©, [{ῃ]. 
Определим теперь отображение φ. Любая точка ὦ из 0 
определяет единственную цепочку {C,} в пространстве Q, . 


которая ввиду (πι) соответствует единственной цепочке {C,} 
в Q(C,<>C, для всех п), и эта вторая цепочка определяет 


единственную точку φῶ из (ΩΩ. Так как все эти шаги можно 
проделать в обратном порядке, то отображение ф взаимно 


однозначно и область его значений совпадает со всем QQ). 
Таким образом, условие (1!) изоморфизма удовлетворяется. 

Обратимся к условию (15). Теперь Q) есть метрическое 
пространство с метрикой, унаследованной от ©, и 0-полем 
of ‹ борелевских множеств из О, состоящим из тех под- 
множеств пространства ©, которые лежат в οἵ. Пусть 


I —класс множеств А из Fo, для которых ФАЕс‹Я и 


P(A)=P(@A). Если СЕЯ’,, то ФС есть то множество из Я’, 
которое соответствует множеству С по условию (ла). По- 
этому класс 5 содержит 8,„, а следовательно, и конечные 
и счетные объединения множеств, принадлежащих O,. Так 
как класс &., очевидно, монотонный, то из леммы ὃ сле- 
дует, что & = с ‹. Эти и аналогичные результаты, где Q 


и © меняются местами, показывают, что если A CQ), то 


AGF в том и только том случае, когда PAG οἵ, и что 
при этом Р(А)=Р ($4). Поэтому условие (10) удовлетво- 
ряется. 
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Покажем, что если {C,} и {D,}— цепочки, определенные 
соответственно. точками © и ®’ из YQ, то о’=То в том и 


только том случае, если C, CT О для всех ths (Ана- 


логичное предложение верно для Ωρ.) Ее сео при 
n>1, то обе точки То и ®’ лежатв Ορ. при п>Ги должны, 
следовательно, совпадать. С другой _ СТОРОНЫ если wo = То, 


то элемент C, разбиения ©, и элемент Τ᾽ 'Dy-1 разбиения 
-_1 
Т @,-; имеют общую точку ὦ. Так как первое из этих раз- 


`‘биений измельчает второе, то C, CT D,_. 
Предположим теперь, что ὦ EQ, и Ta), так что 


go EQ, и фГо = О... Пусть {С}, {Da} {С} и {D,} — цепочки, 
определяемые точками ὦ, Го, φῶ, фГо соответственно. Для 
того чтобы Е 4 i что Тфо = pla, достаточно проверить, 
что Ca om Sar Ho так Kak ‘o переходит в То, то 
GE aT Далее;  Ο, >С, И Dont ВЕ так что 
бе. ВЕС. ВР WD, Поэтому С ПРЕ ape имеет 
HOMO AH TEBE ES меру и, значит, непусто; отсюда следует, 
что Cy ый Dex: 


Мы показали, что тройка (Q), О, ф) удовлетворяет усло- 
виям ([,) и (15) определения изоморфизма и что она удовле- 
творяет условию (1.), ослабленному в соответствии с заме- 
чанием 2, следующим за определением. Поэтому преобра- 


_ зования Ти T изоморфны. 


Изоморфизм и спектральная эквивалентность * 


Хотя эта книга лишь слегка касается изометрических 
операторов, порожденных сохраняющими меру преобразо- 
ваниями, мы все же должны указать на различия между изо- 
морфизмом и спектральной эквивалентностью. 

Если Т-—сохраняющее меру преобразование Ha простран- 
стве (©, «Я, P), то равенство (ИР (®)={ (То) определяет 
некоторое преобразование гильбертова пространства L*(Q) 
интегрируемых с квадратом функций на (©, ¥, Р). Kak 
было показано в $ 2, оператор U (там он обозначался Т) 
изометрический. Покажем, что если Т изоморфно некото- 
рому другому преобразованию Т, определенному на про- 
странстве (©, «Я, Ρ) то изометрический оператор U 
абстрактно совпадает с изометрическим оператором Us πο- 
рожденным Ha пространстве [2 (0) преобразованием г 

Пусть Ти T изоморфны относительно тройки (6ρ, Qo, φ). 


`Для функции ] из пространства L'@) обозначим через Vi 


Ν 
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функцию на ©, принимающую значение }(фо) в точке a. 


(Vj определена только на Q); продолжим ее любым обра- 
зом на © — элементы пространства L?(Q) определены с точ- 
ностью до множеств меры 0.) Очевидно, что И является 


линейным отображением из /[,2 (2) в [7 (9). Из свойств изо- 
морфизма (1!) и (15) следует, что И — взаимно однозначное 
отображение, сохраняющее длину и скалярное произведе- 
ние, и область его значений совпадает со всем [2 (9). На- 
конец, из свойства (19) следует, что VU = UV, или U=V UY, 

Говорят, что операторы в гильбертовом пространстве, 
связанные посредством такого отображения V, имеют 
идентичную спектральную структуру, или спектрально эквива- 
лентны; это — понятие одинаковости применительно к опе- 
раторам. Мы показали, что спектральная структура поро- 
жденного изометрического оператора инвариантна по 
отношению к изоморфизму. (Она является инвариантом и 


по отношению к сопряженности.) Если операторы И и U 
спектрально эквивалентны, то можно говорить, что сами 


преобразования Τ и Т спектрально эквивалентны. 

Функция ], принадлежащая пространству L?(Q), является 
инвариантной (fj (То) =} (®) п. в) в TOM и только том случае, 
если Uf=/. Далее, преобразование Т эргодично в том и 
только том случае, если все инвариантные функции являются 
почти всюду константами. Эти функции как элементы про- 
странства L?7(Q) получаются друг из друга умножением на 
скаляры, поэтому Т эргодично в том и только том случае, 
когда подпространство решений уравнения ПО{/=} одно- 
мерно. 

Если это подпространство одномерно, то’то же верно 
для любого оператора, спектрально эквивалентного U. По- 
этому если известна спектральная структура оператора U, 
то известно, в частности, является ли преобразование Т 
эргодическим. Таким образом, спектральная структура по- 
рожденного изометрического оператора — более точный ин- 


вариант, чем эргодичность: если Г и Г спектрально экви- 
валентны, то они либо оба эргодичны, либо оба неэргодичны. 
Можно также показать (см. Халмош [3]), что спектральная 
структура — инвариант более точный по сравнению с пере- 
мешиванием. 

Покажем теперь, что сдвиги Бернулли порождают изо- 
метрические операторы, имеющие совершенно одинаковую | 
спектральную структуру. При обсуждении энтропии уже 
указывалось, что из теоремы Колмогорова (которую мы 
докажем в $ 7) следует, что существуют сдвиги bep- 
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нулли, имеющие различные энтропии и потому неизоморф- 
ные. Таким образом, . энтропия — инвариант, дающий воз- 
можность различать некоторые преобразования, которые не 
различаются с помощью спектральной структуры, и, разу- 
меется, бесполезно пытаться различить их с помошью таких 
инвариантов, как эргодичность и перемешивание, ибо они 
еще менее точны, чем спектральная структура. (С другой. 
стороны, имеются спектрально различные преобразования 
с одинаковой энтропией, например циклические переста- 
новки Rk точек равной массы для различных К.) 

Пусть Т — сдвиг Бернулли. Возьмем пространство состоя- 


ний р = {1, 2,..., г} и вероятности Pj, Po, ..., р, и предпо- 
ложим, что все р; положительны. Пусть векторы ἕξ; = 
= (&;(1), ..., &(г)), =1, 2,..., г, таковы, что 

2a ры (®) Ey (®) = 8:5 Ppl oo et. (5.18) 
И 


Е. - (5.19) 


Иными словами, векторы (&, (1) Урь..., &(r) V p,) обра- 
зуют ортонормированный базис в г-мерном пространстве. 

Рассмотрим бесконечную в обе стороны последователь- 
ность и=(..., и, Up, И,...) элементов пространства 
{1,2,..., г}. Пусть % — совокупность таких последователь- 
ностей, у которых лишь конечное число координат и» OT- 
лично от |. Определим для последовательности и из 46 
функцию g, на пространстве ® формулой 


би (©) ae Па, (ея (©) р (5.20) 


где х„-— координатные переменные. Tak как лишь конечное 
число и, отлично от |, то произнедение (5.20) на самом 
деле` конечно (см. 5.19). 

Функции ©, являются элементами пространства L*(Q). 
Так как переменные X, независимы относительно меры в; 
то в силу (5.18) имеем 


(ζ-εᾱ- Π Ley (tn (©)) Bo, (a (0)) P (da) = 


n=—oo 


Σ | - Ie ит» 4, Ὁ ce YY. 


Итак, функции gy ортонормированы, 
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Любую функцию из L?(Q) можно аппроксимировать 
Κ 


δ 
в смысле L? простыми функциями > 01 4,. Так как множе- 
i=! : 


ства A; можно аппроксимировать множествами, зависящими 
только от конечного числа ‘координат (цилиндрами), то 
функции, зависящие лишь от конечного числа координат, 
порождают L*(Q). Но функцию, зависящую, скажем, только 
от И координат, можно идентифицировать с точкой г”-мер- 
ного пространства. Так как &; порождают г-мерное про- 
странство, то такая функция является конечной линейной 
комбинацией функций g,. Поэтому {g,: и = %} — ортонорми- 
рованный базис в L?(Q). 

Определим отображение 0: 46 > соотношением (0u),= 
=U,-;. Так как 


(и) (в) = ви (Тв) = Швы, (» (©), 


TO 
Ug, 7 и. 


Пусть теперь и®), и@),...— такая последовательность 
‘элементов из Y, что и® состоит целиком из единиц, и -ε 
~ 0"u) при 152] для всех п=0, +1,... (u не являются 
сдвигами друг друга) и любой элемент ἡ из WY можно пред-. 
ставить в виде и = 0"и() для некоторого #=0, 1, ... и не- 
которого и =0, +1, ... (любой элемент и есть сдвиг неко- 
торого wu). Пусть fyp=g,0 Ἡ }, “ἰῷ для i=l, 2, 

ий =0, +1,.... Тогда система {9,: ие #} принимает вид 


Го 
ee ey Fics ἮΙ, ο» ть eee 


ἐν ᾗνν-ν Бо fo +. 


Элементы этой системы образуют ортонормированный 
базис в L*(Q); Ок=К и ζῃ =Ё, м для ἱ511 и п=0, 


Я Такая спецификация спектральной структуры опе- 
ратора U не зависит от г и от вероятностей ру, ро, ..., р... 

Мы показали, что изоморфные сохраняющие меру пре- 
образования спектрально эквивалентны. Только что полу- 
ченный результат вместе с фактом существования неизо- 
морфных сдвигов Бернулли показывает, что спектрально 
эквивалентные преобразования совсем не обязаны быть изо- 
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морфными (a также сопряженными). Иными словами, спек- 
тральная структура порожденного изометрического опера- 
тора не является полным инвариантом. 


Замечание. По поводу примера 5.4 см. Харрис [1].. 

Понятие энтропии было введено в теории связи Шенно- 
ном [1]. Колмогоров [2] определил энтропию общего сохра- 
няющего меру преобразования; важный вклад был сделан 
Синаем [1]. 

Теоремой 5.1 мы обязаны Нейману [2]. Последующуно 
информацию и ссылки можно получить у Якобса [1, 2]. 

В книге Халмоша [3] дано широкое обсуждение поро- 
жденных изометрических операторов. 


6. СВОЙСТВА ФУНКЦИЙ Н (4) И в (4%, T) 


‚ Полезным вспомогательным понятием является понятие 
энтропии (или условной энтропии) поля ‹« при заданном 
поле Φ, определяемой формулой 


H(4|#) = 2 P(B) S n(P(A18)) = 


ya - 3 PCAN B)in (ALB), (6.1) 


где суммирование производится по атомам полей и Φ, 
за исключением тех атомов В поля «2, которые имеют 
меру 0. 

Tuxe, выбирающая некоторую точку Ὁ из пространства © 
в соответствии с вероятностной мерой P, сообщает экспери- 
ментатору, какому атому поля эта точка принадлежит. 
Однако обычно у экспериментатора нет уверенности отно- 
сительно того, в каком атоме поля ‹ лежит точка о, и сте- 


пень его неуверенности измеряется величиной 2 n(P (A|B)), 


где В —тот атом поля #, который содержит a Таким обра- 
зом, величина (6.1) измеряет среднее количество неопре- 
деленности относительно исхода эксперимента οἵ при усло- 
вии, что известен исход эксперимента %®. Или, иначе, 
величина Н (A| F) измеряет количество дополнительной ин- 
формации, получаемой экспериментатором при узнавании 
исхода ‹ в предположении, что он уже знает исход F. 
Если обозначить символом 2 поле, состоящее из про- 
странства © и пустого множества, то, очевидно, что 


ее 
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Свойства функций H(A) и H(A|F) 


Выведем следующие пять пар соотношений, касающихся 
энтропии и условной энтропии для конечных полей. Основ- 
ной является первая формула: 


(Αι НУ Θ|6)--Ἡ({|6}- Η(Β|οέν 6), 
(Ai) H{(AV @)=H(A) + H(#| 4). 


Формула (А!) означает, что информация, содержащаяся 
в экспериментах «6 и вместе, равна информации, содержа- 
щейся в αἵ, плюс информация, содержащаяся в Я при 
условии, что результат эксперимента ‹ известен. Анало- 
гичная интерпретация имеет место для формулы (А)). 
Условная энтропия не убывает по своему первому аргу- 
менту: | 


(As) H(A|S)<H(#|E), если ACB, 
(Аз) | Н (4) < Н(%®), если СФ. 


Это означает, что если ACF, то % измельчает A; знание 
исхода эксперимента влечет знание исхода экспери- 
мента ο; следовательно, ΘΖ) более информативно. 

Условная энтропия не’ возрастает по своему второму 
аргументу: 


(Аз) H(A|C)<H(A|#), если © DF, 
(Аз) Ἡ(οΕ| 6) < Η (A). 


Если знание исхода эксперимента ©’влечет знание исхода 
эксперимента «ΘΖ, TO остающаяся экспериментатору неопре-. 
деленность относительно исхода эксперимента cA должна 
быть меньше, если он знает исход эксперимента 9, чем если 
он знает только исход эксперимента F. 

Условная энтропия полуаддитивна по первому аргументу: 


(Δ) H(AV @|\C)SH(A|O)+H (FS), : 


(А) H(AV @)<H(A)+H (9). 
Наконец, 

(As) H(T'A|T'#) =H (A|F), 

(As) H(T" A) =H (A). 


; : Ξ ΄ 
Заметим, что для любого i формула (А) немедленно 
получается из (А;), если заменить соответствующее поле 
полем 2, | 
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Соотношение (Δι) аналогично формуле для условных 
вероятностей 


P(Af\B|C)=P(A|C)P(B|ANC). 
В самом деле, (Aj) следует из этой формулы и того факта, 
что атомы полей AV Pu AVS являются соответственно 


множествами вида АПВ и сы где A, Ви C— атомы 
полей A, Φ κ ὅ 


H(AV #19) =- δι P(ANBNC)InP(ANBIC)= 
=— У P(ANBNC)InP(A|C)— 
A DG 
ie P(ANBNC)InP(B|ANC)= 
--ᾱ P(ANC)INP(AIC)— — 
= P(BA(ANC))InP(B|ANC)= 
ΡΕ 


Εεπησές Φ, то AV ® =; следовательно, (Ag) вытекает 
из (Αι) и очевидной неотрицательности условной энтропии. 

Для доказательства соотношения (As) заметим, что 
так как функция y(t) = — tint выпукла, TO 


di n(P(AIC))P(C1B) = n( 23 P (AIC) P(C[B)). 


Так как аб, TO B есть объединение атомов ПОЛЯ ©’ 
следовательно, 


РВС) PLE 
УР(А1С)Р(С1В)= РПС PO) — Р (АВ). 
С CcB 


Поэтому 
> п(Р(А1С))Р(С1В) «-η{Ρ (Α1Β)). 


Умножая это неравенство на P(B) и суммируя его по 
атомам Аи В, получаем (А.). 

Наконец, (A,) следует непосредственно из (А!) и (А.). 
Соотношение (Ας) очевидно. . 

Если A=%, то H(A|#)=0 ввиду (Aj). О 
ясно, что если и %® почти равны в TOM смысле, что 
каждый атом одного из них отличается от некоторого атома 
другого на множество малой меры, то величина H(A|#) 
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должна быть малой. Эта идея лежит в основе доказатель 
ства следующего результата. 


Теорема 6.1. Предположим, что конечное поле A со- 
держится в о-поле, порожденном полем F ц (или, более OOWO, 
каждый атом поля A отличается на множество меры 0 
OT некоторого элемента O-NOAA, порожденного полем F у). 
Тогда для любого положительного & существует такое конеч- 
ное подполе # поля Fo, что H(A|#)<e. 


Доказательство. Не ограничивая общности, пред- 
положим, что все атомы Ay, ..., А, поля « имеют. поло- 
жительную меру. Так как функция y(t) непрерывна и 

1 (0) =y(1)=0, то существует такое число 6, (0<4<1), что 
Е, когда либо ON ts, либо | -6<15<1. 

Если мы сможем указать в οἵ ϱ конечное подполе F, 

атомы которого B,, ..., В, удовлетворяют условию 


P(A; |В;) | -- δρ, oe Aree Г, 


то получим P(A;|B;)<6) для j Ai и, следовательно, 
=. 
—H(AL®) = УР(В)т(Р (АВ) < YP (B) +=. 
ij ij 


Если атомы В; удовлетворяют условию 


P(A;+B)<d= min 6, se (6.2) 


то, так как Р (А) <Р(В ть Core будем иметь 
Р (4;)/2<Р(В;) и, _ следовательно, Р(В)-Р(А; ПВ) <6< 
<6)P (B;), или P(A;|B;)>1—6). Поэтому достаточно полу- 
чить поле Я с атомами, удовлетворяющими условию (6.2). 
В силу предположения теоремы для каждого i суще- 
‘ствует такое множество В’ ИЗ ПОЛЯ oF ϱ, что P(A; + В;)<А, 
где A будет выбрано несколько позже. Если ij, то 
P(BiN Bi) <P (Bit A: ) + P(A; +В}, < 2K, Tak что P(N) < 
<r, roe N= (J (8:0 ΒΡ}. Определим B;=B;—N 
bie 7 
для 1<i<ru Ao U В;; тогда множество В; при- 


д 
надлежит полю oF, и P(A; +B)<Atr(r—1)A для < Г; 
следовательно, P(A,+B,)<(r—1)(A+r(r—1)A). Если A до- 
статочно мало, то (6.2) выполняется. 


Следующая теорема иным образом уточняет идею, что 
если атомы полей Фи # близки, то величина Н (& |2) 
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мала. Теорема эта будет использована. только Β гл. 5, 
в теории кодирования. 


Теорем а 6.2. Пусть число атомов 15 ..., A, поля A 
равно числу атомов Ву, .. +. Dp OAR «Ῥ. 1οεσα 


Н (|) <ч(а) +чт1-а-аш(- 1), 
где 
d= 3 P(B) P(Aj| By) = ΣΙ P (ANB) = & P (Ai) P(Bi| Ai). 

Доказательство. Прежде всего можно записать 


H (419) = & P(B)[n(P (4;1B,)) + Σι n(P (АВ). 
j {5-1 


Для фиксированного / uMeem!)— 
Υ η ивр) РАВ Ут [ев + 
ix] ix] δῖ: | 
+ п(Р (АЙ Βὴ)} <P (Aj | Bi) In (r — 1) -η{Ρ{Α}} ΒΛ}. 
Следовательно, Γη | 
H (4) #)< ΣΙ Ρ(Βλ|η(Ρ(Α,1Βλ}Εἠ{Ρ{ΑΠ| В) + 
| + У P(B) P(4j| B) In 1. 


Вторая сумма равна dIn(r—1). Если & — поле с атомами 
Е = U (A; B,) и Εὖ, то первая сумма pa H(@|F). 


ix] 
A Tak Kak 


Η (21| ®) < Н (8) -- η(Ρ (E)) + n(P (E)) -- η (4) +n(1—4), 


то доказательство завершено. 

Если P(BS|A;))<e для всех |, TO de; использование 
этого факта приводит к несколько более 5 экономному дока- 
зательству теоремы 6.1. 


1) Для неотрицательных чисел t,, ..., tg, дающих в сумме 1, спра- 


ведливо неравенство >) η (#1) < ША. 
i=1 
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Свойства функции A( 4, Г). 


Докажем сначала, что верхний предел в определе- 
нии (5.13) функции h(A, Г) может быть заменен обычным. 


пределом. Действительно, (Ai) и (Ag) означают, что 


Н (x У TA) = η(ν TA) — a(V TA) = 


i=0 i=] 
_ Суммируя πο k, имеем 


HN, r'4)= H (4) + > (я 


i=0 


=H (Vv ra) —H (у ra) 


ν TA), 


ν τ “κε не возрастает πο k и, 


i= 


В силу (А. функция H| A (4 


следовательно, имеет конечный предел. Беря среднее по 
Чезаро, получаем из предыдущего равенства 
EA η 


Кроме того, обе последовательности, пределы которых 
берутся в (B,), невозрастающие. ges de a рассуждение 
приводит к соотношению 


(в!) ορ... н( A 


(B,) h(A, T)= lim -Η ην ги) lim н(я 
nh > ος 


п > oe 


п > © 


ν ria), 
i=0 
где, как и выше, стремление к пределу монотонно. Если 


Т обратимо, то 


(BY) : h(A, T)= lim н[*\ Μ TA), 


n-> co 


что является результатом применения Т” к правой части. 
равенства (B)). | 

Соотношение (В!) дает еще одну интерпретацию функ- 
ции h(A, Т). Количество неопределенности относительно 
исхода (п-1)-й реализации г перис A при 
данных исходах первых ий реализаций A, TA, . Е 


измеряется величиной Н|Т "A ν ТЯ]. Эта величина, 
i=0 


_ которая измеряет также количество информации, доставляе- 
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мой (η + 1)-й реализацией в добавление к уже имеющейся 
от первых и реализаций, стремится к A(4, Т) при noo, 


Из соотношений (В) и (As) непосредственно следует 
- (By) h(A, T)SA(B, Τ), если ACF. 
Если и<у9 (и и>0, если пы ee Г необра- 
_тимо), то’ 
| п—1 v | nt+o—u-1 
у гу rt} г" ν ra}, 
‘так что в силу (As) 
Ly V7 Til \/ т! |= пои Е H <a tye qk 
п о tag: к. тей n+vu—u ο |, 
Из (Βι) следует 
(Вз) вм ИЯ, г) в (4, Τ), 
ξ =. | 5 =U : : 
Если u=v=1, то (В.) превращается В 
h(T 4, T)=h(4, т), 
а при и=0 


в (У ТЯ, г)- h(t, Г), 


откуда видно, что информация, приходящаяся на экспери- 
мент в последовательности экспериментов 

ё 9+1 v+2 

Ут Ут“, Ут, 
=0 
такая и в последовательности 
| —1 —2. 
A, T σέ, Τ᾽ ος, 


Это естественно вследствие того, что соседние эксперименты 
‘первой из этих последовательностей ны 
Вели k 2&1, то | 


(RAL nk-1 
1н(У [М та] as ЕН н(\ тя, 
ix0 '.1]-5ο 
так что опять в силу (Bj) ое 

» ? Pi} 3 
(By) | a(V 4, η; Г), Wel, 


. 7% 
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И, наконец, ‚еще одно нужное нам свойство функции 
h(A, T), являющееся обобщением неравенства (Bo): : 


(Bs) h(4, T)Sh(#, T)+ H(A| #). 


Для доказательства этого соотношения заметим,’ что 
7: / ; 
в силу (А5) И (А!) 


п-—1 ; n—l ; n—-1 
н(\ гии) н(У T'AV V. rg) 
i=0 Ai a | 
п—1 n-1 n—-1 
ига ну ra), 
Последовательно применяя (А.), (Аз) и (As), имеем 


п-1 и—1 n—l : n—1 
η(ν голу гв) < Σ aris ν rig)< 


n—1 
= Σ Η(Τἑ|Τ Φ)--πΗ(4|.8. 
- Комбинируя предыдущие неравенства, получаем 
η--] n—l - 
-- ην ra) <= η(ν rg) +H(A|#), 


откуда B силу (В!) следует (Bs). 


7. СВОЙСТВА ФУНКЦИИ A(T) ~ 


Теорема Колмогорова 


Мы докажем теперь теорему Колмогорова, которая по- 
зволит нам во многих случаях вычислить энтропию 


pif) 5 Bap h(A, Г). 


Теорема 7.1. Если T обратимо и \/ TA = F ο), TO: 
n=—o 
h(T)=h(A} Г). 


_ Доказательство. Мы должны показать, что если 
B — любое конечное подполе поля of ; TO 
NF, Tye h(A, T). 


"οἵ 


: - Paatudine на атомы поля cf называется в этом случае! обра- 
Защ разбиением для Т или просто ος ah a — Прим. ред. 
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Пусть A, = у T* A; из (Bz) следует 
h(A,, T)=h(A, Τ), 
а из (Bs) 


h(#, Τ) Ἐς Γι (υξη, T) + H(# | 4p) =h (A, Г) + H(#\A,). 


Поэтому достаточно показать, что. 
lim Я (#| 4,)=0 
n->oo 


Докажем это с помощью теоремы 6.1. 


Если Ff (= Ох» TO οἵ 9 является (конечно аддитивным) 
п 
` полем, порождающим поле οἵ. В силу теоремы 6.1 для 


любого положительного 8 существует такое конечное под- 


поле 8 поля Fo, что H(#|S)<e. Далее, δ принадлежит 
некоторому οἴη; если п > пу, то в силу (А.) 


fad 1s Beis wen iat aa Bea 


"ον OK a3bIB aeT ик 


λ 


Замена An на ν T-"A в этом доказательстве приводит 
k= 


“K следующему та ДлЯ оо". не ое обра- 
тимости T. | 


n=0 


κος ‚Если ιντ-α- F, το h(T)=h(A, Τ). 


Вычисление энтропии 


Теорема 7.1 сделала законными вычисления энтропии 
в $5. Проведем еще раз. эти вычисления, но несколько 
иным способом. Пусть Т — общий двусторонний сдвиг, соот- 
ветствующий процессу {x,} с конечным пространством со- 
стояний о (пример 1.2), и пусть &— поле событий, наблю- 
‘давшихся в момент времени 0 (поле с атомами {x,=i}, 


[Е ФС). Так как ν' T"A=F, то из теоремы 7.1 следует 


n=—oo 


h(T)=h(A, T). Вычислим h(A, Τ) по формуле 


h(A, T)= lim H ea V г“). 
ΚΕ β--ἱ | 
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| eg a 
Произвольный атом поля \/ ΤΟ имеет вид {x_, =i}... 


= 


ees Xp =i_,}, и, следовательно, 


н(я LV, гл = a ‘ P{x., = bt, oo) Χ-ῃ = (= Χ 
= αι ees, ип ; 


x Bn (P Xo = |X =i ἐν home EP 


Отсюда вытекает, что энтропия сдвига удовлетворяет 


условию | 
к. НВ 
где г— число состояний. ге 
Если Т-— сдвиг Бернулли (ри, ..., ρε), то 
Р4 = ig |x) =i, .. 19 Xn = Ey =p; 


и все ΠΡ | М rt) совпадают с — Ур; шр.. 
k=] fo: 


Итак, 
h(T) = h(t, T)=— 2 piln pr. | (7.2) 


Пусть теперь ее м. а: мат- 
рице перехода П=(р;,) и стационарным вероятностям p=(pi). 
На этот раз P {xo = ig! ᾱ- pei, os.) Xn = lg} = Pi_i,» ТАК ЧТО 


ean | V r'A) = = — » PEP An ys 
k=1 i_ss rey bp 3 
Пре р Pi_ij=— 2 рр ln ри. 


Поэтому | | 
h(T) =h(A, T)=— 2 Pipi; 13 Ρι)» βία; 
и это справедливо без каких бы то ни было предположе- 
ний регулярности, относящихся к матрице II. 

Этот результат можно также установить, доказав что 


п-1 | | 
ην, Γης See) 2 рр piz— Qa i Inpp (ne i, 


‚ Разумеется, сдвиг Бернулли является также марковским 
сдвигом, и в этом случае (7.2) и (7.3) дают одинаковый 
результат. Таким образом, два сдвига Бернулли, или, более 
общо, два сдвига Маркова неизоморфны, если их энтропии 

различны. В частности, сдвиги Бернулли (1/2, 1/2) и 
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(1/3, 13, 1/3), имеющие энтропии ш2 и In3 а eee 


неизоморфны. 
Не представляет труда показать, что СДВИГ примера 3.3 


имеет энтропию — (= x р: in pi. 


В силу следствия теоремы 7.1 соотношения (7.2) и (7.3) 
справедливы для односторонних сдвигов Бернулли и 
Маркова. 


᾿ ᾿ со 
Интересно, что если Т обратимо и \ Т"Я=Я, το 
n=0 


h(T)=h(A, T)=0. Интуитивно: в этом случае прошедшее 
определяет будущее или будущее определяет прошедшее; 
это зависит от того, какая выбрана ориентация, и, следо- 
вательно, соответствующая условная энтропия должна стре- 
_ миться к 0. _ 

Доказательство заключается в облечении этой идеи 
в математическую форму. В самом деле, из этого следует, 

co 


что A en te Pog = № T-'A, так что по теореме 6.1 поле 


U \/ 1- if содержит для каждого = такое конечное под- 


n=1 ἱ--ἰ 


поле 9, что Ни) <= Πο тогда нау т) < 


i=] 

<H(4A|#)<e eg большего п, так что в силу (B)) 
-В(Т)=Ё(%, T)= 

_ Опираясь на a факт, можно показать, что энтропия 
иррационального поворота окружности (пример 1.5) равна 0. 
Пусть атомы поля «έ-- верхняя полуокружность A и ее 
дополнение Α΄. Если То = со, то полуокружность Τ-Α начи- 
нается в точке с”. Если с не является корнем из единицы, 
то множество {c7!, с?,...} всюду плотно и, следовательно, 
любая полуокружность может быть аппроксимирована полу- 


° окружностями 77 "A и, таким образом, лежит в γ᾽ Τ-"ο4. 
n=0 
ΟΟ 


Из этого вытекает, что Ag т ‚содержит St дугу и, 
n=0 
следовательно, совпадает с οἵ... 
Из соотношений (B,) и (В.) вытекает, что h(T*) = АСТ). 
для Е 1. Если Т обратимо, то h(T)=A(T"), так как 


- 
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Таким образом, мы можем вычислить энтропию любой сте- 
пени преобразования Г. 


а. if 2. Если k>1, то В (Т*) = ЕВ (Т). Если T o6pa- 
TUMO, A(T) с для любого целого К. 


Если Т-вр о окружности То = со, где c— корень 
из единицы, το й (Т)=0. Действительно, если с есть корень #-й 
степени из единицы, то ТГ=/[, так что h(T)=k-A(l)=0 


Некоторые обобщения !) 
Пусть’ Я, и Я, — с-подполя ПОЛЯ οἵ ; если каждое мно- 
жество из Y, отличается от некоторого множества из 5% 


на множество меры 0 и обратно, то будем писать ὁ] =. 
Следующая теорема Оле в числе APY Ta результатов 
теорему 7.1. 


Теорема 7.3. Пусть {F7,}— неубывающая последова- 
тельность (конечно аддитивных) полей. Если 


Ν VTS, =F 
n= 
‘или если Т обратимо и 


co 
V 
n=1 


-- By 


UG, =F. 


TO AE 
hf) = tim Sup Аа Г). - 


д оказательство. _Дадим доказательство для случая 


У ν т =. ~ 9. Если 9, -— поле, порожденное U ни 
п=| [= 


со 


$ ,— поле U 5€,, то каждое множество поля я отличается 


OT ООО множества о-поля, порожденного полем oF 0» 
на множество меры 0, откуда в силу теоремы 6.1 и соотно- 
шения (В) следует (так же как в центральном PRY дока- 
зательства теоремы 7.1), что 


hie pup: es 2). (7.4) 


η Изложенные в этом разделе результаты в дальнейшем использо- 
ваны не будут. 
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Если 2 CF ο, то @ содержится в OU, при некотором и и, 
следовательно '), имеет атомы By, ..., By, вида Ἢ 


т 
-U Но и 


где @;„ Ее ZF, Если Ф—поле, порожденное множествами 


Gi, TO OHO конечно, ACH, и % = ν TA. Поэтому 
Ϊ i=0 | | 
в силу (Bo) и (Bs) имеем 


h(B, n<n(V TA, r= hic, Т) < sup h(A, 7). 
i=0 HS, 


Так как правый член этого неравенства не убывает по п, 
то теорема следует из (7.4). Случай обратимого Т разби- 
рается аналогично. 


Если &, есть о-поле и T'19%, < 9, то Т может рассмат- 
риваться как сохраняющее меру’ преобразование Τη на про- 
странстве (©, &,„, Р). Если это так, то из теоремы 7.3 сле- 
дует, что если последовательность {¥,} не убывает и 


У 9—9, то в (Г) = т h(T,). 


“iia. B Teopeme 7.3 B качестве ay поле ο΄, Γη Kak 
следствие теорему 7.1. 


Следствие 1. Если {A,}—- неубывающая последова- 


тельность конечных полей, причем У A,=F , το 
ate 


h(Ty= “lim h(A,, Τ). 


Следствие 2. Если ® < ν Т- Я или если T обратимо 
Fens | 


и фе \ Τί, το h(#, T)<h(A, Τ). 


1=— 0 


Для доказательства этого следствия рассмотрим Т как 


преобразование на (©, wa Ру), где F о — поле ν TA или 


i=0 


\/ ТЯ и Ро— сужение Р на Fo. 


i=—oo 


1) Если # и «№ — поля, то поле, порожденное полем οή΄-[] «№, состоит 
из конечных объединений множеств вида М [| №, где М = «4 и №М= οἵ"... 
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-ελοκὂίππο. 3 ECan $ — некоторое поле и либо 


м 7-19 5. οἵ, либо T обратимо и ν GF, το 


== 


iit) Sup h(4, Т). 


Следствие 4. Если «Я ,—поле, порождающее «Я, то 
h(T)= sup h(A, T). : 
AC Fo 


Это последнее следствие дает возможность вычислять энтро- 
пию прямых произведений. Пусть Г; (i= 1, 2) — сохраняющее 
меру ‘преобразование на пространстве (Ω,, «Я ;, P,;); тогда 
прямое произведение ΤΙ Χ T, — сохраняющее меру преобразо- 
вание на произведении этих двух пространств: 


(Τι Χ Το) (οι, @) Ξ-(Τιϑι, Τυωο). 


Teopema 7.4, Прямое произведение преобразований Г! 
и Т› обладает свойством 


h(T, X Ty) = h (Τι) +h (Τη). 


Доказательство. Если σέ; — конечное подполе поля 
_ Я ,(i=1, 2), то, обозначив 2; = {0, Q;}, имеем 


п-1 п—1 = п! 
У (ХТ) (A, X = aA (Tr At X 22)V У (21 x ΤΣ As) 


(Если A; u Ж.-—это о-поля в пространствах Q, и Q), TO 
A, X Ay есть о-поле в 9. ХО., порожденное A; X Ao, где А, и Αν 
лежат в vf, и 5 соответственно. Если <4, и σέο -- конечные 
поля, то поле 4; Х №, также конечно и его атомами являются 
множества Д,ХА,, где А, и А. —атомы полей αι и οἵ; 
_ соответственно. Два поля в правой части этого равенства 
‚независимы в том смысле, что если М и М принадлежат соот- 
ветственно этим полям, το Р(МПМ)=Р (М)Р (№), где 
 P=P,XP,; отсюда следует, что 


Н № (Τι Χ Toy! (A; x 40) = 
| =Н (У (TAL xX 9)) +H (у (2: x И) rs 


i=0 


-н(\ ге) ην ΤΣ 4). 
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Деля на n и переходя к пределу, получаем 
й (1 < Ὄξον T,X Το) =h(A, T\) + й (9, То). 


Теперь теорема вытекает из следствия 4, так как прямо- 
аи с основаниями в F Ἡ 9. порождают поле 


F 1X 


В качестве последнего вычисления найдем энтропию при- 
мера 1.7 с мерой Р, Е как произведение мер по 


формуле 
n+k 


Ρ{ω: x(0) Ey п<1<п+8 = Пи(Е), 8) 


где и есть мера на’борелевских подмножествах прямой. 
Из следствия 3 вытекает 


й(Т)=зир Σ и (в (Е;)), 


где верхняя грань берется по всем разбиениям Ej, ..., Е» 
прямой на борелевские множества. Если ц не состоит исклю- 
чительно из точечных Macc, то Й(Т) = со. Если μ COCTOHT из 
точечных масс; скажем, Pir Ρε... Το 


h(T) =— Σ p;\n pj. 


Если этот ряд расходится, To #(Т) бесконечна. 


Замечание, Материал этого и предыдущего парагра- 
фов почеринут из работ Халмоша [4] и Брауна [1], а также 
из статей Колмогорова` и Синая. Дальнейшую информацию 
по этому поводу можно получить из превосходной обзорной 
статьи Рохлина [2]. Статьи более позднего времени вклю- 
чены в библиографию, помещенную в конце книги. 
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Некоторые нерешенные задачи 


В $5 мы отметили, что если 7, — циклическая переста- 
новка k точек равной массы, то # (Т,) = 0, хотя различные T, 
неизоморфны. Кроме того, энтропия любого вращения окруж- 
ности также равна 0, хотя оно неизоморфно никакой 


') Материал этого параграфа, который состоит преимущественно из. 
вопросов, встречается в последующем изложении лишь эпизодически. 
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перестановке Т,. Энтропия, таким образом, не является пол- 
ным инвариантом. 
Если Т-— сдвиг Маркова, то, как мы видели, 


‚ В(Т)=— ~ DiPij Ри. 


Рассмотрим три матрицы перехода 


ее" 
ως ee nr 
ее oa es 

Pettis or 


и соответствующие стационарные распределения вероят- 


ностей 

(3 я (J Lit η (1 = \), 

Ce OSs, Pa а Sas Ror УЕ Е 
пусть Τι, Το и T,—cooTBeTcTBylolulNe сдвиги Маркова. Тогда 
T,— перемешивающий сдвиг, Г. — эргодический, но не пере- 
мешивающий, a Т.— даже не эргодический; в частности, 
никакие два из этих сдвигов неизоморфны. Так как энтро- 
mua. всех сдвигов равна ш2, то она не является полным 
_инвариантом и для сдвигов Маркова. 

Общий вопрос об условиях, при которых энтропия 

является полным инвариантом, порождает несколько спе- 
циальных неразрешенных вопросов. 


Вопрос Г. Является ли энтропия полным инвариантом 


для сдвигов Бернулли? Пусть Т — сдвиг Бернулли (ри, ..., Pr) 
а Т- сдвиг Бернулли (pi, ..., pz). Если Tu Т изоморфны, то 
р pri pis — 2 βι η βι. (8.1) 


Следует ли из (8.1), что Tu Τ изоморфны? Ответ неизве- 
стен. Если (рь..., р,) — некоторая перестановка (в... -Р>) 


(г = 7), то ответ положителен — это тривиально. Однако возьмем | 
наборы вероятностей (1/4, 1/4, 1/4, 1/4) и (1/2, 1/8, 1/8, 1/8, 1/8). 
Тогда (8.1) выполняется, HO a priori у Hac не больше осно- 
ваний ожидать изоморфность Т и Т, чем изоморфность 
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сдвигов Бернулли (1/2, 1/2) и (1/3, 1/3, 1/3). Мешалкин дока- 
зал поразительный факт: Τ и Т изоморфны. Это позволяет 
думать, что ответ на вопрос | положителен. 

В этом направлении Синай доказал следующую замеча-. 
тельную теорему. Сказать, что два сохраняющих меру пре- 
образования Ги Т изоморфны, значит сказать (пренебрегая 
множествами меры 0), что существует взаимно однозначное 


отображение ф пространства © на ©, которое переводит 


меру P B Р и удовлетворяет условию Тф=ФТ. Пусть мы 
требуем, чтобы областью значений отображения ф было 


все О, чтобы ф переводило Р в Би удовлетворяло условию 
Тф= ФТ, но не требуем, чтобы оно было взаимно однознач- 


ным. Если такое отображение существует, говорят, что т 
есть факторпреобразование преобразования T. Легко пока- 
зать в этом случае, что р (Г) <Е(Т). Если Т и T являются 
факторпреобразованиями друг друга, то h(T)=A(T); тогда 
говорят, что они слабо изоморфны. (Можно показать, что 
слабый изоморфизм сохраняет не только энтропию, но и 
свойства эргодичности и перемешивания.) Синай показал, 
что два сдвига Бернулли с одинаковой энтропией слабо изо- 
морфны и отображения $: Ω-»Ω͂ и фт: Q>Q; входящие 
в определение слабого изоморфизма, могут быть выбраны 
так, чтобы они зависели только от прошлого. Это означает, 
что й-я координата (Mo), [(ф6)„| точки фо [φῶ] является функ- 
цией координат ..., ®,-1, ®,[..., @ьь @,| точки ®[6]. 

Хотя обратное тривиально, но неизвестно, когда слабый 
изоморфизм влечет обычный изоморфизм. Для того чтобы 
показать заключенную здесь трудность, рассмотрим такой 
пример. Пусть T=T— двусторонний сдвиг Бернулли (1/2, 1/2) 
с пространством состояний {0, 1}. Тогда Т и Т слабо изо- 
морфны: соответствующие отображения ф и ф определяются 
соотношениями | 


(PO), = On-1 + On (mod 2), 
(φῶ); = ὥς. Ἔ ῶ} (mod 2). 


Разумеется, будучи тождественными, Т и Т изоморфны. Ho 
каждое из отображений фии ф является однозначным ото- 
бражением, при котором точке соответствуют два прообраза, 
и весьма трудно понять, как их можно использовать для 
того, чтобы восстановить тождественное или любое другое 


обратимое отображение, которое делает Ти Т изоморфными. 


> 
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Е” 


Вопрос 2. Является ли энтропия полным инвариантом 
для перемешивающих сдвигов Маркова? Ответ на этот во- 
прос также неизвестен. ae 


Сдвиги Колмогорова 


Прежде чем поставить наш третий вопрос, введем новое 
понятие. Пусть οἵ --ποπε событий, наблюдавшихся в момент 
времени 0, для общего сдвига с пространством состояний ϱ 


(пример 1.2). Если «Я „= М TA, το αἵ, есть с-поле, поро-_ 
k=n 


жденное множествами {x,=i}, где i@oeo и kon. Сдвиг Г 


‚называется, сдвигом Колмогорова, если все множества 0-поля 


Я „=[\|Я „ тривиальны, т. е, имеют меру либо 0, либо 1. 
n=l : 
Множества из cf „ зависят от „сколь угодно далекого буду- 
щего“ (см. конец aS 4, где подобный класс множеств опре- 
делен для преобразования, связанного с непрерывными 

дробями). 

Существует общее понятие преобр азования Кол могорова '), 
определяемое инвариантным образом и приводящее к упо- 
мянутому выше понятию в случае сдвига. 

В $ 11 мы увидим, что любой сдвиг Колмогорова — пере- 


 мешивающий. Можно построить пример, показывающий, 


что не все сдвиги, обладающие свойством перемешивания, 
являются сдвигами Колмогорова. 

Из закона нуля — единицы следует, что любой сдвиг 
Бернулли является сдвигом Колмогорова. Следующее рас- 
суждение показывает, что сдвиг, соответствующий непри- 
водимой непериодической цепи Маркова, является сдвигом 
Колмогорова. Действительно, в этом случае lim р =» 


так что если г, = max ‚|2 -- ρι]; to |{πιε,;--0. μα теории 
п 


цепей Маркова к. что если множество А принадлежит 
σ-ΠΟΠΙΟ, порожденному множествами {x,=i}, где <], 
а множество В принадлежит 0-полю, порожденному множе- 
ствами {хь=0}, где R>1l+n (τ. е. полю F ивы), то = 


|P (ANB)—P(A)P(B)|<e,. (8.2) 


1!) В отечественной литературе принят термин К-автоморфизм. Onpe- 
деление К-автоморфизма см. в сноске 2 на стр. 111. — Прим. ped. 
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Если В принадлежит полю οἵ „, то оно принадлежит и 
ПОЛЮ oF ju, при всех п, так что для любого цилиндра A 


Р(АПВ)=Р(А)Р(В). _ (8.3) 


Но совокупность множеств A, для которых справедливо (8.3), 
‚ образует о-поле и, следовательно, совпадает с οἵ. Таким 
_ образом, (8.3) имеет место для А=В, так что ее ἘΠΕ 
_няется либо 0, либо 1. 


Вопрос 3. Является ли энтропия полным инвариантом 
для сдвигов Колмогорова? Ответ неизвестен. 


В качестве последнего вопроса рассмотрим следующую 
проблему изоморфизма, которую одна энтропия разрешить 


не может. Пусть Ти Т— два варианта преобразования при- 
мера 1.7, соответствующие произведениям двух различных 
мер и ий на прямой (см. (7.5)). Если ни та, ни другая меры 
не состоят исключительно из точечных масс, то п (Т) = 


-- (Т) = с. При каких условиях в этом случае T и Т изо- 
морфны? Если меры цв и ft совсем не имеют точечных масс, 
то хорошо известно, что существует отображение прямой 
на саму себя, переводящее p в й. Это отображение можно 


расширить так, чтобы получить изоморфизм между τα 
А что можно сказать о смешанном случае? 


Замечание; Шо поводу изоморфизма сдвигов Бер- 
нулли (1/4, 1/4, 1/4, 1/4) и (1/2, 1/8, 1/8, 1/8) см. Мешалкин [1]. 
О понятии слабого изоморфизма см. Синай [8] '). Колмого- 
ров [2] ввел преобразование Колмогорова, назвав его ква- 
зирегулярным °). 


η См. также Синай [9]. — Прим. Οδ 

2) Общее определение таково: обратимое сохраняющее меру преоб- 
разование Т пространства (Q, ¥, P) называется автоморфизмом Колмо- 
горова (или К-автоморфизмом), если существует 0-поле ὅΓορς со 
свойствами: 1) 77. >92) \/ "Fo =F, 8) Л ΤΊ ο тривиально. В cay- 

п 

чае сдвига`в пространстве последовательностей в качестве «5 можно 
взять 0-поле, порожденное величинами х; при #<0 или при 10. — Прил. ред. 


ГЛАВА 3 


Условные вероятности и математи- 
ческие ожидания) 


9. УСЛОВНЫЕ ВЕРОЯТНОСТИ 
Конечный случай 


Понятие условных вероятностей. относительно о0-поля лежит 
в основе многих построений современной теории вероятно- 
стей. Рассмотрим сначала понятие условной вероятности 
множества М относительно другого множества A. Эта веро- 
ятность определяется равенством Р(М|]А)=Р(МПА)/Р (А) 
(если только Р(А) не равна нулю, в последнем случае она 
вообще не определена). 

Если Тихе выбирает ‘точку ® из пространства Q в соот- 
ветствии с вероятностной мерой P (на о-поле οἵ), то Р(М) 
есть вероятность того, что ®`взята из М. Если эта выбран- 
ная точка принадлежит А и если Тихе сообщает об этом 
(и только об этом) экспериментатору, то для него P(M|A) 
есть вероятность того, что ® принадлежит также и М. 
Будем исходить из этой эвристической формулировки. 

С другой стороны, если точка, выбранная Tuxe, оказа- 
лась принадлежащей Α΄ и экспериментатору сообщено об 
этом, то для него новая вероятность события ® ΕΞ М равна 
P(M|A‘). Удобно связать эти две условные вероятности 

ступенчатой функцией 


P(M|A)= oa ‚ ели o EA, 
i (@) = Я Ac ! 
| (MA) =e, если OEA’, 


Если Tuxe st экспериментатору, какому множеству — A 
или Αἵ — принадлежит выбранная ею точка, то вероятность 
события o@M для экспериментатора равна f(@). Хотя 
экспериментатор не знает аргумента ® функции f, он бла- 


1) Читатель, оный с понятиями условных вероятностей и мате- 
матических ожиданий относительно о-поля, может опустить эту главу, 
при необходимости находя в ней нужные ссылки. Читатель, незнакомый 
с этими идеями, также может опустить ее, если он согласен принять 
несколько дальнейших теорем без доказательства или если он будет 
предполагать, что встречающиеся в этих теоремах сдвиги являются 
марковскими. 
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годаря Тихе достаточно осведомлен для вычисления f(o). 
Заметим, что значение {(@) определяет, будет ли OSA или 
& © Α΄, если только не выполняется равенство P(M|A) = 
=Р(М| А‘) (означающее независимость М и А), вследствие 
которого условная вероятность множества М совпадает с без-. 
условной. Поэтому вместо того, чтобы сообщать, принад- 
лежит © множеству А или Α΄, Тихе могла бы сообщать 
значение } (0). 

Множества Аи А‘ образуют οἵ -разбиение пространства Ω. 
Только. что изложенное приводит нас к произвольному 
of -разбиению, или, что то же, к произвольному конечному 
подполю A поля οἵ. Если Д,,..., A, являются, атомами 
подполя A, то для любого М из οἵ рассмотрим ступенча- 
тую функцию | 

j(o) =P (MA) == 


P (Ay) ‚ если ὢ ΕΞ ΑἹ, γόνο ἕο 


Tuxe, выбрав точку © из © в соответствии с мерой P, го- 
ворит экспериментатору, какой из атомов подполя A ее 
содержит. Новая вероятность множества М для экспери- 
_ментатора имеет значение } (ὦ). Как и раньше, эксперимен- 
татор после сообщения Тихе имеет достаточные данные для 
вычисления }(ώ), даже если само w ему неизвестно. И снова 
знание [(®) равносильно знанию того, какое из А; содер- 
ЖИТ ®. oe | 

Будем обозначать через P{M||.4} функцию (случайную 
величину) { и называть ее условной вероятностью множе- 
ства М при заданном конечном поле A. Аргумент © обычно 
опускается, но в случае необходимости будем писать 

Таким образом, Р{М|]«} — ступенчатая функция, значение 
которой на A; равно обычной условной вероятности P(M|A,). 
Это определение требует дополнения, так как Р(М]А;) не 
определена при P(A;)=0. Мы можем оставить P{M||.4} 
неопределенной на таких атомах поля of, а можем при- 
писывать ей какое-то фиксированное значение, скажем, 0. 
Выберем третий путь: если P(A;)=0, то значение P{M]||.4} 
на A; есть произвольное действительное число '). Итак, 
если о содержит атомы меры 0, το P{M||.4} является для 
них целым. семейством функций на ©. Чтобы подчеркнуть 
это, мы будем называть P{M||.4} вариантом условной 


1) Мы требуем, чтобы это значение было одним и тем же для всех 
точек Aj, так что P {M||-#} есть ступенчатая функция, для которой атомы 
поля < являются множествами ее постоянства. 


8 Зак. 1491 
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вероятности множества М при заданном οἵ. Заметим, что 
любые два варианта равны почти всюду. 

Любой вариант случайной величины P{M||.4} обладает о 
двумя основными свойствами: 1) эта функция интегрируема 
и измерима относительно οἵ Ὦ) и 2) равенство 


а. | eo 


справедливо для любого множества А из конечного поля ый: 
_ Легко показать, что любая случайная величина, обладаю- 
щая этими двумя свойствами, является вариантом функ- 
ции P{M]|| A}. 


‚ Общий случай 


Так как οὔ состоит из. конечных ой непересе- 
кающихся атомов-,,..., A,, то знание того, какой из ато- 
MOB ПОЛЯ. A содержит ὦ, равносильно знанию того, какое 
из 2’ множеств поля vl содержит ὦ, а какое нет. Этот BTO- 
рой подход переносится на произвольное ов-подполе поля οἵ. 
_^ Если &— такое о-подполе, то можно представить себе, 
что Тихе выбирает точку ® и затем открывает эксперимен- 
татору, какие из множеств G поля & содержат ὦ, а какие 
нет °). Определим функцию P{M || δὴ, значение P{M||F}, 
которой в точке ® является тем, что, как мы интуитивно 
чувствуем, должно быть для экспериментатора новой веро- 
ятностью события ® ΕΞ М после получения сообщения Тихе. 

Для любого М из οἵ определим Р{М|5} как интегри- 
руемую случайную величину, которая а) измерима отно- 
сительно о-подполя & и b) удовлетворяет функциональному 
уравнению 


_[ РАМ} аР=Р(МП6), Ges. (9.2) 
: 


Если с конечно, то это определение сводится к предыду- 
щему (см. 9.1). 

Условие (а) соответствует требованию, чтобы Р{М | F} 
можно было вычислить на основании только одного сооб- 


1) Для этого мы требуем, чтобы Р{М|]«*} была постоянна даже на 
атомах меры 0. 
2) Тихе предъявляет не ©, а вектор с компонентами lo (ὦ), отмечен- 


ными индексами С из ὦ. 
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щения Тихе. Условие (b) допускает игровую интерпретацию. 
Предположим, что Тихе, передав экспериментатору свое 
сообщение, предоставляет ему возможность поставить на 
наступление события М (если М не лежит в &, он не знает, 
наступило это событие или нет). Она требует выплаты на- 
чальной ставки и берется выплачивать одну драхму, если 
событие М наступило, и ничего — в противном случае. Если 
условная вероятность события М для экспериментатора 
после сообщения Тихе равна Р {М || 7}, то справедливый раз- 
мер начальной ставки равен Р{М| 5} драхм. Если экспе- 
риментатор решит принять пари и внесет эту ставку, то он 
выиграет | —P{M|| 7} в случае наступления Ми —Р{М|] 7} 
в противном случае, так что его выигрыш равен 


(1—P {MI 9})1,,+ EE {M || 9}) ye =I, — P {MIF}. (9.3). 


Если OH отклоняет пари, TO его выигрыш автоматически 
равен 0. Предположим, что он придерживается стратегии 
принимать пари, если наступает событие @ и отклонять его 
в противном случае. (С здесь есть некоторое множество 
из 9.) Его ожидаемый выигрыш при этой стратегии равен 
интегралу от (9.3) по множеству G: 


[ @н- РАМ ар. A) 
G : 


Но (9.2) является. в точности требованием того, что (9.4) 
равно нулю для каждого G из &. Если Р{М|] 5} удовле- 
творяет нашим эвристическим требованиям, то справедливая 
начальная ставка не приведет ни к выгодной, ни к невы- 
годной для экспериментатора стратегии. 

Нужно, разумеется, доказать существование случайных 
величин Ρ{Λ| 7}, удовлетворяющих условиям (a) и (Ὁ), что 
мы сделаем, применяя теорему Радона — Никодима. Опре- 
делим вполне Sia pTHEHYO функцию ф множества Ha о-поле & 
равенством 


g(G)=P(MNG), Ges. 


Тогда ф есть конечная мера Ha 5, которая, очевидно, абсо- 
лютно непрерывна относительно меры P, рассматриваемой 
на & (для GES из P(G)=0 вытекает φ(Ω) -- 0). Следова- 
тельно, в силу теоремы Радона — Никодима существует 
интегрируемая. рН р, измеримая относительно & и 


8* 


~ 
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удовлетворяющая условию !) 
J ГАР = 0(G), Ges. (9.5) 


Возьмем в качестве } функцию P {M|| 7} и назовем ее услов-_ 
ной вероятностью события М при заданном ὅ; тогда (9.5) 
принимает вид (9.2). Таким образом, функция, определяющая 
‘условную вероятность, существует. 

Может существовать и более одной такой случайной 
величины Ρ{Μ| 5}. Мы видели, что это может быть так 
даже для конечного &. Тогда, как и раньше, говорят о не- 
котором варианте условной вероятности. Любые два таких 
варианта. { и g интегрируемы и измеримы относительно & 


и удовлетворяют соотношению | faP = J eaP для всех G 


G 
из Y; отсюда следует, что pe ous. C peaches до этого 
обстоятельства условные а. определены единствен- 
ным образом 3). 


Пример 9.1. Предположим, что MES, что всегда 
имеет место, если, например, < совпадает со всем о-по- 
лем ef. Тогда P{M || Y}=Iy п.в. Интуитивно, если MES, 
‚то знание того, какой элемент из & содержит ὦ, означает, 
в частности, знание того, наступило или не наступило со- 
бытие М. | 


Пример 9.2. Если #=2={0, 9}, то P{M||$},=P(M) 
для любой точки ®. Из сообщения Тихе экспериментатор 
не узнает ничего такого, чего бы он не знал раньше. 


Пример 9.3. Пусть © — плоскость R? и οἵ — класс бо- 
‘релевских множеств на этой плоскости. Любая точка ὦ из Q 
есть пара (х(®), y()), хи у-— координатные переменные. 
Пусть 0-подполе YF состоит из вертикальных полос, т. е. 


1) Мы применяем ae теорему радона — Никодима не в исходном 
пространстве с мерой (©, ¥, P), а в пространстве (9, %, Р). Это обеспе- 


чивает измеримость 7 относительно 5. Хотя f dP есть тогда интеграл. 


а 
от f B смысле (2, %, P), нетрудно показать, что он совпадает с интегра- 
лом в смысле (©, ς- 

2) Наше определение слегка отличается от данного Дубом [1]. Он 
допускает в качестве варианта любую функцию Р{М|]}, измеримую 
относительно «, интегрируемую, удовлетворяющую функциональному 
уравнению (9.2) и равную п. в. некоторой функции, измеримой относи- 
тельно ©. Если « конечно, это равнозначно отказу OT требования, чтобы 
P {M||-7} была постоянна на атомах, имеющих меру. 0. 
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элементами поля & являются прямые произведения ЕХА! = 
--{ω: х (о) ЕЁ}, где Е — борелевское множество на прямой. 
Если экспериментатор знает для каждой вертикальной по- 
лосы EX R', содержит она ® или нет, то он знает это, 
в частности, для каждой полосы {}Ж Ν᾿, где = — действи- 
тельное число, и обратно. Таким образом, сообщение Тихе 
эффективно дает значение х (6). Предположим теперь, что 
Р- вероятностная мера на οἵ, имеющая плотность р (&, η) 
относительно плоской меры Лебега: 


_Р(М)= | | eG n) ἀξ dn, 
5 ! 


Покажем, что если M={o: y(o) ЕЁ}, где Е — линейное 
борелевское ‘множество, то вариантом функции Р(М| 7) 
является W(x (@)), где 


jee η) dy 


φ(8)--------------. | (9.6) 
[ р (5, n) dy 
В! 

Так как 1 (х (@)) — измеримая функция от х (©), она измерима 
относительно &. Элемент &. имеет вид {o: х (о) ЕЁ}, 
поэтому нужно только показать, что 


[ ψα(ω))Ρ(άω)-Ρ{1εΕ,γε}. = (01) 


w= ΕΙ : 
Однако так как случайная величина х имеет ое НИЕ 


на прямой с плотностью р (Е) = Гос, η) dy, то левая часть 


В! 
равенства (9.7) равна 


fr@ved=[{ [re n) dn} a - 
В E F | 


= | | р (Е, η) ἀξ 41 =Р {хе ЕЁ, ges, 


EXF 


где предпоследнее равенство следует из теоремы Фубини. 
Таким образом, ψ(χ(ω)) есть вариант функции Р{М|| | F}. 

Правая часть равенства (9.6) является классической 
формулой для условной вероятности события {уе=РЁ} при 
условии х=Ё. Наше обсуждение может рассматриваться 
как оправдание этой классической формулы или как. 
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пример, ‘оправдывающий. наше математическое определение 
условной вероятности. 

Если х — случайная величина на ‘вероятностном простран- 
стве (О, «Я ,Р),. то σ-ποπε 5, порожденное ею (наименьшее 
о-поле, относительно которого: величина х измерима), состоит 
из множеств вида {w: х(®) ЕЁ}, где Е пробегает различные 
линейные борелевские множества. Так как знание того, 
какие множества этого вида содержат ὦ, а какие нет, рав- 
носильно знанию значения x(@), назовем Р{М ||} условной 
вероятностью события М. при заданном х и будем обозна- 
чать ее P{M||x}. Пример 9.3 представляет собой частный 
случай. Таким же образом определим условную вероятность 
P{M||x,, хо, ...} события М при заданной конечной или 
бесконечной последовательности величин XX), Χρ, ... как 
P{M|| 7}, где & есть σ-ποπε, порожденное этими величинами. 


Пример 9.4. Рассмотрим марковский сдвиг (при- 
мер 3.1). Мера Р определяется соотношением 


Р {Xn = ay bn coer Хи = ἐμεὶ = и Di nPini nmr Pingi-1 Г 


(В этом примере существенно именно это соотношение, а не 
сам сдвиг.) По формуле условной вероятности относительно 
конечного поля имеем 


РН... oy =P (o)t UB.) (9.8) 
Ho для Toro, чтобы доказать интуитивно очевидную формулу 
Р {Хо = i| ... X_9, ΞΡ = Рх_, (в), 1 п. В., (9.9) 


потребуется следующая теорема, простым следствием кото- 
рой эта формула и является. 


Теорема 9.1. Пусть 9, — (конечно аддитивное) поле, 
порождающее в-поле 57. Интегрируемая функция | является 
вариантом функции P{M|| 7}, если она измерима относи- 
тельно SF и 


[ГаР=Р(МПв) (9.10) 


для всех G из Fp. 


Доказательство. Каждая часть равенства (9.10) как 
функция множества С является мерой на &. Так как функ- 
ции совпадают на &., TO они должны совпадать и на Я. 


Ὁ) Случайные величины хи принимают не числовые значения; их зна- 
чения лежат в конечном множестве р. Условные вероятности таких ве- 
личин все еще определяются в терминах 0-полей, которые они поро- 
ждают. 
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Пример 9.5. Пусть Т-— диадическое преобразование 
То = 26 (тоа1) на единичном интервале с мерой Лебега 
(О, «Я ,Р) (см. пример 1.6). В $ 1 мы показали, что если М 
инвариантно и F лежит в поле с ‹, состоящем из конечных 
объединений непересекающихся диадических интервалов, 


то М u F независимы, так что ТЕ НЕ Р(МПР. Так 


как. порождает я. из теоремы 9. Е следует 
Κα πὴ Е BI) PO SLs ne 
Поэтому P(M) равна либо 0, либо |, и мы получаем. новое © 
доказательство эргодичности преобразования is 

Следующий пример показывает, что интерпретация услов- 
ной вероятности, использующая поведение Тихе, не проходит 
в некоторых патологических случаях. 


Пример 9.6. Пусть (©, οἵ, а. интервал © 
с мерой Лебега P на σ-ποπε F борелевских множеств и & 
есть о-подполе множеств, которые либо счетны, либо имеют 
счетные дополнения. Тогда функция, тождественно равная 
Р(М), является вариантом функции ΡΛ ὅλ}: 


P{M|| 9}, = Р(М) п. в. See 9.11) 


Но так как & содержит все одноточечные множества, то 
знание того, какие элементы из Y содержат о, а какие нет, 
равносильно знанию самой точки ®. Таким образом, после - 
получения сообщения Тихе экспериментатор знает, насту- 
‚ пило событие о=М или нет, и мы должны иметь 


i, если o€M, 
РМ 79 = 0, если OEM, Ay) 


Математическое определение приводит к (9.11), эвристиче- 
ское—к (9.12). Разумеется, (9.11) правильно, а (9.12) — нет '). | 
Несмотря на то что наша интерпретация в некоторых‘ 
случаях непригодна, она дает удобный способ представления 
условных вероятностей и не может привести к трудностям, — 
так как доказательства на нее не опираются. 


1) В этом частном случае можно избежать трудностей, допуская ва- 
рианты, почти всюду равные некоторой измеримой относительно ὁ’ функ- 
ции. Более сложные примеры (те самые, которые демонстрируют воз- 
можное несуществование условных вероятностных мер, см. конец этого 
параграфа) показывают, что это не Веера помогает. 
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Свойства условных вероятностей 

Для любого варианта условной вероятности имеем 
[Ρ19}4Ρ- Ρ(ΜΠΩ):0 при G&S. Так как P{M|| 9} 
ЕТ. относительно 67, то она почти всюду неотрица- 


тельна. Аналогичное рассуждение показывает, что она почти 
всюду не превосходит 1: 


(Р). — 0O<P{M| S$} < π. в. 
_ Если Р (М) =1, το [Ρ{ΜΙ $} dP = P(G) для всякого = Я: 
ο 


следовательно, ae gee 
(Ρο) Ρ{Μ| 8} =1 п. в., если P(M)=1 
Аналогично 
(Ps) P{M|| 9}=0 п. B., если Р(М)=0 


Докажем, что 
(P3) Р{М,0М.| 63} = 
= P{M,||7}+ P{M,|| 63} п. в., если М, П М. = ©. 


Мы должны показать, что правая часть равенства (P,) удо- 
влетворяет двум требованиям, налагаемым на варианты 
функции P{M,UM,|| 7}. Ясно, что она измерима OTHOCH- 
тельно &. Так как М, и М. не пересекаются, то для ЕЯ 


[м9 РМ) dP = 
G 


= | P{Ml| }dP + | РАМ} аР = 
G G 


= P(M,) G)+P(M,NG)= 


так что функциональное равенство выполнено. 
Аналогичными рассуждениями можно -доказать, что 


(Р) Р{М,-М9}=Р{М|9}-Р{М 8} п.в., если М»=Мь 
(55) Ρ{Λ| 8) -1--Ρ{Μ| 9} п. в.; 
(Рз”) [Ρ{λΠ| 8} -- P{Mp || F}|< Ρ {Μι + M,|| 8} п. в. 1) 


1) Как обычно, + означает симметрическую разность. 
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Предположим теперь, что {M,}— невозрастающая после- 
довательность множеств с пересечением М, это`обозначается 
М, УМ. В силу (Рз) и (P,) последовательность P{M,]| F}, п. в. 
He возрастает и, следовательно, имеет предел f(o) п. в. 
Функция | измерима относительно &; в силу (P;) и сходи- 
мости ограниченной монотонной последовательности 


[ faP=lim | P{M,|| аР = lim Р(М,П0)=Р(МПб) 
BR ea hag n->oo 


для любого GES. Поэтому [есть вариант функции Р{М| 9}: 


(Р.) P {M,, i) EOS B., если M, | ΛΙ. 
Аналогично 
(Р4) P{M, |9} P{M||F} п. B., если Mn tM. 


Наконец, в силу (Рз) и (Ра) имеем 
(РЭ РО м, 19| = 2 P (Mn IF} п. Β., 
: | | если Ми ПМ, = @ (m#n). 


Пример 9.7. Из соотношений (9.8) и (9.9) для, цепей 
Маркова следует, что. 


PLXG SU. vey Kacy FG = P {xy = Их. eB; 


Аналогичное рассуждение показывает, что если М — цилиндр, 
зависящий от координат с неотрицательными индексами, то 


P{M]|..., хх} =Р{М|]х} п. в. (9.13) 


Используем только что доказанное свойство, чтобы пока- 
зать, что равенство (9.13) справедливо, если М — произволь- 
ное множество из о-поля, порожденного ху, Χι,.... Для 
любого такого М и. любого положительного = существует 
цилиндр Мь, содержащий лишь координаты с неотрицатель- 
ными индексами и такой, что P(M + M,)<e. В силу (P3”) 
имеем 


=| P{M ||x_)}— P {M, |lx_}|<{M + M, ||x_)} π. в. 


Tak Kak ue |x.}dP =P(M+M,)<e, το 


РА < eh =o Ἔ. 
Аналогично |Р{М]..., х-5, κ.) --Ρ τ... χο δ. превос- 
ходит Л с вероятностью, не большей e/A. Поэтому левая 
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и правая части равенства (9.13) отличаются друг от друга 
более чем на 2A с вероятностью, не превосходящей 26/λ. 
‚Полагая =—0, а затем A->0, получаем (9.13). 


Функции и меры Е 

В этом параграфе принята „глобальная“ точка зрения. 
Мы связываем с каждым фиксированным М из «Я Ἠεκοτο-. 
рую функцию (точнее, класс функций) Р {М ||}, определен-. 
ную на всем пространстве ©. Что будет, если мы изменим 
точку зрения, фиксируя © и предполагая, что М пробегает οἵ ? 
Получим ли мы вероятностную меру на οἵ ? Если это так, 


_ то, разумеется, только что доказанные результаты (P,), ..., (Ps) 
сводятся к стандартным фактам, относящимся к мерам. 
Пусть ὁ — конечное поле с атомами G;,..., G,. Если 


P(G;)=0 и P(G,;)>0 для остальных i, то вариантом функ- 
ции Р {M ||7} будет 


P (Mf) Gi) 
! | — 7, если оЕСЦ, i=2,..., 1, 
Ρ{μ]ϑ]ο-! 200. ee 
7 0, если @€&G). 


При таком выборе варианта условной вероятности Р {М |9}, 
как функция от М-является вероятностной мерой на οἵ, 


если ое а. ... UG,, и не является мерой, если «= G. 

Мы выбрали „неправильный“ вариант. Если взять, скажем, 

вариант г ; ae | 
P (Mf Gi) 


! ος O SG She 2. 22 OT; 
Е | P (Gi) pe f 3 
| Ρ(Μ), если o&G,, 


το Р{М ||}, есть вероятностная мера по М для каждого a. 
Ясно, что такие варианты существуют, если & конечно. 
Можно было бы подумать, что для любого о-поля 
< варианты различных P{M |5} могут быть выбраны так, 
что Р{М|] 9}, являются вероятностными мерами по М для 
каждого ') ὦ из ©. Можно показать на примере, что это 
не так. (см. Дуб [1]). 
Предположим, что точка W) обладает тем свойством, что 
P(G)>0 для любого G из &, содержащего в. Это верно, 
например, если одноточечное множество {Mo} принадлежит οἵ 
и имеет положительную меру. Фиксируем любые варианты 
функции Р{М| 9} для всех М из οἵ. Для любого М мно- 


') Если это можно сделать для почти всех ©, то ясно, что это можно 
сделать и для всех ©. 


{ 
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жество {o: Р{М|]9Я},<0} лежит в ив силу (P;) имеет 
меру`0, а следовательно, не может содержать @). Таким. 
образом, Ρ {М ||}, 5:0. Аналогично Ρ {0 ||}, = 1, иесли М» 


не do iat aged TO PIU М» [4 = 2 P {Mall F},.. Следова- 
n δω) nt 5 
тельно, Р{М] 8} „ есть вероятностная мера, если М про- 
бегает «Я. 
Таким образом, условные вероятности ведут себя долж- 
- ным образом в точках, имеющих положительную вероятность. 
То, что они могут плохо вести себя в точках вероятности 0, 
не вызывает затруднений, поскольку отдельные такие точки 
_ не влияют на вероятности множеств. Разумеется, множество 
точек, каждая из которых имеет меру 0, оказывает влия- 
ние, но здесь мы возвращаемся к глобальной точке зрения, 
из которой мы исходили '). | 


Замечание. Колмогоровым [1] было введено впервые 
общее понятие условных вероятностей. Приведенное изло- 
жение ‘следует во всем Дубу [1]. - 
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Определение 


Пусть x — интегрируемая случайная величина на (Ω, οὔ, P) 
и 67 есть о-подполе поля «Я. Определим функцию ф MHO- 
жества на & равенством 
а { хаР. CEs. 
Тогда @ — конечнозначная. (даже и вполне ад- 
‘дитивная функция. Более того, она абсолютно непрерывна 
относительно Р (рассматриваемой на 5). В силу теоремы 


Радона — Никодима существует функция E {x ||}, интегри- 
руемая, измеримая относительно SF. Ἡ удовлетворяющая 


равенству @(G) = | E {x |5} dP для всех G SF, Обозначим 


через E {x ||}, ΠΕ функции E {x | Я} в точке о. 


Ὁ) Желание сохранить локальную точку зрения, наложив на прост- 
ранство с мерой подходящие ограничения, приводит к понятиям прост- 
_ ранства Лебега и измеримого разбиения; см. Рохлин [7]. Для эргодической 
теории эти понятия очень полезны. — Прим. ред. 


- 
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Будем называть эту функцию условным математическим 
ожиданием (или ожидаемым значением) величины х относи- 
тельно &. Она определяется требованиями, чтобы а) Ε {x || F} 
_ была интегрируемой и измеримой относительно ὅν Ub) Е {x || F} 
удовлетворяла функциональному уравнению 


[Е аР = | καρ, сбеЗ. | (10.1) 
G G ee 


Вообще говоря, существует много таких функций; их назы- 
вают вариантами условного математического ожидания. 
Любые два варианта совпадают почти всюду. 

Если’ Y=2, то функция, тождественно равная E {x}, 
является вариантом функции EF \{х || 9}. Если Я9=«, то x 
само есть вариант функции Е {х |5}. Для любого & функ- 
ция, тождественно равная Ε {x}, удовлетворяет приведенному 
выше условию (a) (которое становится более ограничитель- 
ным с уменьшением &), а само х удовлетворяет условию (b) 
(которое становится более ограничительным с расшире- 
нием 5). Эти два условия работают в противоположных 
‚направлениях, ‚и МЕЖДУ ними находится класс Sa PBAHTOR 
функции Е {x || F}. 

Мы интерпретируем Е {x |9}, как новое ожидаемое зна- 
чение случайной величины х для экспериментатора, когда 
Тихе сообщает ему, какие из множеств в & содержат вы- 
бранную ею. точку ὦ, а какие нет. Условия (а) и (ο) соот- 
ветствуют аналогичным в определении условной вероятности. 
Согласно первому, экспериментатор может’ вычислить зна- 
чение E {x ||} после получения сообщения Тихе. Если после 
этого сообщения она предлагает ему выплачивать х драхм 
в ответ на некоторую предварительную ставку, то справед- 
ливая начальная ставка равна Е {х ||} драхм при выпол- 
нении интуитивных требований, связанных с условным мате- 
матическим ожиданием. Если стратегия экспериментатора 
заключается в том, что он принимает пари в случае насту- 
пления G и отвергает его в противном случае (здесь 
Ge), то математическое ожидание его выигрыша равно 


| (x — E {x || Я} аР. Соотношение (10.1) ΤΡΕΟΥΡ чтобы такая 
G 


_ стратегия не давала преимуществ НИ SKGPDAMERTATORY 
ни богине. 


Если 57 — конечное поле, то E {x |157}, должно равняться 
{ хар/Р (G;) для ® из атома G;, имеющего положительную 
; | 2 ᾿ 
вероятность, в то время как Ε{χ||8} может принимать 
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любое постоянное значение на атоме с нулевой вероятностью. 
Это связывает наше общее определение с классическим 
понятием условного математического ожидания гри заданном 
множестве С: 


216} - О) =, {καρ (P(G)>0). 


Заметим, что для множества М = «Я определяющие 
свойства функции E{ly||7} и P{M 13) совпадают. Таким 
образом, 

Ен!) = PIM) if. Be; 


что обобщает соотношение Е {1 y}= P(M). 


Пример 10.1. Если x = Ха, — простая функция, то 
i 
Е{х |9} = διαιΡ {Α;|| 9) п. В. 


Пример 10.2. Исследуем предельную функцию ] в эрго- 
дической теореме. Если | интегрируема, то в соответствии 
_с этой теоремой - 


| п-1 гы 
lim — Wif(T*a)=F(o) пв (103) 
n-> co о 


Для каждого множества А произведение J,/ имеет свою 
„функцию с крышечкой“ ({21}, к которой оно сходится 
в среднем: | | 


п-1| 
lim + У, 4 (T*o) f (T*o) = (1407 (©) п. в. (10.9) 
pes OP 


Если А инвариантно, так что J,(T*o)=/],(@) п. в., то из 
(10.2) и (10.3) следует J,(o)f(@)=(U,f) (©) п. в. Tak как 
(11) и I,f имеют одинаковые математические ожидания, TO 


| тар = | pap = | 14аР 
ИЛИ 


[Тав= [тат .: (10.4) 
А А > 


Очевидно, что’ класс & множеств, инвариантных OTHOCH- 
тельно Т, образует с-подполе поля οἵ и функция f, будучи. 
инвариантной, измерима относительно &. Так как κ 4). 
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выполнено для всех AGYJ, то { есть вариант функции 


E {f || F}. 


Π ример 10.3. Легко показать с помощью замены г пере- | 
менной, что если у (®) =х (То), то 


Е (ут 9) = Ех п. в — (10.5) 
В частности, | с" т = 
3 P{T MTS), = РМ} п. в. (10.6) 


Основные свойства. 


Большинство примеров И результатов предыдущего napa- 
графа переносятся непосредственно. Например, теорема 9.1 
имеет очевидный аналог. Кроме того, те же методы, кото- 
рые были использованы для доказательства (P,), (Ρο) и (P3), 
достаточны для установления следующих трех результатов. 
_Мы всюду предполагаем, что величины x, у ит. д. инте- 

грируемы. 


(Е) Если х=аш в. (а — постоянная), то Е{х 17} =а и. в, 
(Εο) Если xy un. в., то Е{х| 9} <Е{и|} п. в. 

(E;) Если а и 6 — постоянные, το Е{ах + by|| 9} =аЕ{х |} + 

+ ЬЕ{и|| $} п. в. 

Из этих утверждений вытекает очевидное следствие, что 


если х=уп. B., то Е{х|| 9} =Е{у|| 9} п: в. 
Так как ххх} то в силу (E,) и (Е. 


—E{| x || 9} < Е 19} < Е {1х9} п. в. 

и, следовательно, | 
(Ε) [Ε{1|Θ}|«“Ε{|κ||8} π.π. Ἢ | 

_ Нам понадобится следующее обобщение теоремы Лебега 
о переходе к пределу под знаком интеграла: 
(Ε5) — Если lim X= kab -ᾱ, и Рау. πι. B., 
где и интегрируема, то lim Ех |157} =Е{х| 5} п. в. Для 
доказательства ‘рассмотрим. 2 = SUP | --Χ|. Имеем 2, .0 
п. в. И ТЕ (lA Ех Е, 14 п. в. в силу (Е; и 
(E,). Достаточно поэтому показать, что Ε {z, | <} п. в. В силу 


(E,) последовательность Ε {z, ||} п. в. не возрастает и; сле- 
` довательно, имеет п. в. предел g. Нужно доказать, что 


. / 
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в =0 п. в. или, поскольку © неотрицательна, что ЕЁ {0} =0 
Ho -B силу теоремы о переходе к НЕ под знаком инте- 
грала, примененной к величинам г„ (|2 |< 25), | 


Е {в} < [ ве, ар = _| 2,dP 0. 


Если х измерима относительно <, то, разумеется, Ё {x || F}=x 
п. в. Постоянно приходится пользоваться следующим обоб- 
щением. | 


Теорема 10.1. Если х измерима относительно & и если 
у и ху интегрируемы, то 


Е {ху} = хЕ {и} п. в. (10.7) 


Доказательство. Предположим сначала, что х = leq: 
‘где G,= 9. Нужно показать, что /α,Ε {1 || 9} ‘есть вариант 
функции EF {/¢,y||F}. Так как [в,ЁЕ {y|| 7}, очевидно, измерима 
относительно &, то нужно только проверить функциональное 
равенство | 3 


[1ω,Ε{υ|93}4Ρ--- | ТоуаР, Ges. 
G G 


Но это сводится к равенству 


[ ву®}ар= | yap, 
GNGo : спа, 


которое выполняется в силу определения E {y|| 7}. Таким 
образом, (10.7) выполнено, если x — характеристическая 
функция множества из &. Далее, для любой функции x, 
измеримой относительно &, существуют ступенчатые функ- 
ЦИИ X,, Измеримые относительно & и такие, что | х„|<|х| 
И lim Жи =. Так как. | ху || xy | И функция [ху| интегри- 


pyema, TO из (Es) вытекает lim E (ху 19} = Е {ху |} п. в. 


Ho E {x,y |} = XnE{y ||F} в силу уже доказанного и, разу- 
меется, lim XnE {y || P}=xE {y ||F}. Поэтому Е {xy || F}=xE {И}. 


Заметим, что мы не и функцию х гр 
руемой. 


Повторные условные а я ожидания 


Взятие условного математического ожидания можно рас- 
сматривать как операцию осреднения, или сглаживающую 
операцию. Переходя от хк Е{х|| $}, мы делаем x „более 
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близкой к константе“. Это можно видеть графически на еди- 
ничном интервале с мерой Лебега, если < конечно и имеет 
своими атомами подинтервалы. Естественно ожидать поэтому, 
‚что осреднение х относительно о-поля &., а затем осредне- 
ние результата относительно более „грубого“ (меньшего) 
с-поля &, должно привести к TOMY же результату, что и 
приведенное сразу осреднение относительно ὦ]. 


Теорема 10.2. Если x интегрируема и о-поля $ и J, 
удовлетворяют соотношению SF, с Fo, TO 


ELE {919} =Е{ |9} п. в. (10.8) 


Доказательство. Докажем, что ΕΕ {x |9} |9} есть 
вариант функции E {x ||F,}. Разумеется, Е {ЕЁ {x |9} |} изме- 
рима относительно ὅσ. Если @ =, то 


[ EE GIF) ар = [ Ε{α [90 ἀρ; 
G : G 


но так как С лежит также и в &., правая часть этого 


равенства равна [ хар. Таким образом, Е {Е {х || 95} |9} 


G 
удовлетворяет функциональному уравнению для вариантов 


функции E {x |9}. 

Мы получим второе доказательство равенства (10. 8), уста- 
новив, что Ё {x ||F,} есть вариант функции Е {Е {x|| 4452} 13}. 
Так как Е {x |9} измерима ‘относительно &, TO hoe 
только проверить функциональное равенство 


{ Etc FdaP = [ Вх ар, GES. 
G G 


Но если GES, то GEA, и обе части Ἔρις, совпа- 
дают с ] x dP. . ! 


etn GJ,=F, το E{x||F} =х mB, так что (10.8) тр и- 
виально. Если &,=2, то (10.8) принимает вид Е {Е {x 9.) }= 
=Е{х} — частный случай формулы (10.1). 

Если 9, < ὅδ», то случайная величина Е {х || 9}, будучи 
измеримой относительно. ὅδ], измерима и относительно $; 
она не изменяется при взятии ее математического ожида- 
ния относительно ὅδ: 


E{E {x |9} |9} = Ε{κ|9ι} п. в. 


Но это дополнение к (10. 8) бесполезно. 
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Неравенство Иенсена 


Для обычных интегралов и математических ожиданий 
неравенство Иенсена состоит в том, что если функция ф 
- вещественна и выпукла '), то 


φ(Ε {x}) < Е {ф(х)} (10.9) 


в предположении, что математическое ожидание существует. - 
Обобщение на случай условных математических ожиданий 
таково: если x и @(x) интегрируемы, TO 


p (E {x || F}) < Е {$ (x) || F} п. в. (10.10) 


Bern FY =2, то (10.10) сводится к eg 9); если Ф(В = #1, OHO 
сводится к (E,). 

Мы докажем (10.10) только для одного случая, который 
нам нужен, а именно когда х принимает значения из конеч- 
ного отрезка [а, 6], a ф определена на этом отрезке. В этом 
случае ф непрерывна и ограничена. Если Αι,..., A, есть 


Я -разбиение пространства 2, το ο Ρ{Α; |2}, =1-для почти 
всех ®. Для любого такого ὦ и любых чисел αι, ..., Gy 
из [а, 6] имеем. 


φίΣα,Ρ (А, || Aa) < Seta) P {All Po 


в силу основного свойства выпуклых фени: ridsromy (10. 10). 
выполняется для простых случайных величин. Ho любая 
случайная величина x со значениями из [а, 6] является пре-. 
делом простых случайных величин X, со значениями из [а,-6]. 
Так как последовательности {Χρ} и {ф (x,)} равномерно огра- 
ничены, то (10.10) вытекает из (E;). 


Одна специальная формула 


В дальнейшем нам понадобится тот факт, что если 
vf — конечное поле с атомами Aj, ..., Α,, то 


А: РМаа ао 

Риму) У РАЯ 1 В: — (10.11). 
i= i ’ к 

Для почти всех ®, для которых знаменатель в правой части 

обращается в нуль, числитель также обращается в нуль, 

и мы принимаем отношение равным 0. Если F=2, To (10. 11) 


1) Prana изложение вопросов выпуклости можно найти в гл, 1 
книги Зигмунда [1]. | 


9 Зак, 149] 


+ 
} 
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обращается в исходную формулу для условных вероятностей 
относительного конечного поля 
Покажем, что сумма в правой части равенства (10.11) 


является вариантом функции P{M||4\V FZ}. Так как эта . 


сумма измерима относительно A ν &, нужно только про- 
верить выполнение функционального равенства. Но AV ὅ 
состоит из конечных объединений непересекающихся мно- 
‘жеств вида Α;ΠΩ, где С е=Я, следовательно, достаточно . 
проверить, что 


[ Ув. 4РЕР(МПА,П 6), (919 


А, Па i 


где с; =Р{МПА, | Я}/Р{А, |}. Так как A; не пересекаются 
HM. gj; измеримы относительно &, то левая часть равен- 
ства (10.12) равна 


| taje,4P = | 1дв,аР= | Е лв} АР = 
А; ПС Е а ΄ G ἃ 
= [ g)P{A)||P}dP = | Ρ{ΜῃΑ/|9}4Ρ--Ρ{Μῃ 470). 
G ; Ge: | 


Пример 10.4. Пусть А— такое множество, для которого 
Р(А)>0. Определим меру P; соотношением 


P\(B)=P(B|A), BEF. | (10.13) 
Докажем одну формулу, связанную с (10.11): 
| _ P{MN AI}. 
P\{M |9} = РЯ Ἰ' 5. ΡΙ (10.14) 


(равенство имеет место с точностью до множества Р!-меры 0). 
Заметим, что в силу абсолютной непрерывности ΡῚ относи- 
тельно Р обе части равенства (10.14) определены с точ- 
ностью до множеств Р\-меры 0. Правая часть равенства 
(10.14) измерима относительно Y; нужно показать, что она 
_ удовлетворяет равенству 


. Ἡ 


PIMNAISY μμ... 
f Spars ЧР =РиМПО) Ged, — 


‘которое эквивалентно 


ΓΕ РП} рр | 
+ Praray dP = P(MN ANG), Gap. 
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Ho если Ως:-ὅ, TO левая часть этого соотношения равна 


[ts Liege) aP= | Ela prapey [93 4? = 


7 [Prana Εὐλ1ϑγάρ-[ Р{МПА|}АР=Р(МПАПО), 


что доказывает (10.14). Если А оказывается лежащим в YS, 
то (10.14) принимает вид 


Pi {M||9} =Р{М|} п. в. Py. — (0.15) 


Пример 10.5. Если Т — неэргодический сдвиг, то он не 
имеет своим респектом некоторый цилиндр С. Так как пре- 
дельная функция 


lim Уре 7. (©) (10.16) 


п> < Yee 


не является тогда константой почти всюду, TO существует 
такое а, что инвариантное множество A, = {a : [‹ (®) < а} удо- 
влетворяет условию 0<Р(4)<1. Так как С — цилиндр, 
то Αρ лежит в о-поле, порожденном хи, Хи.1, ... для любого п, 
что следует из (10.16). Обращая временную шкалу (рассма- 


тривая Τ᾽), мы видим, что существует также нетривиальное 
инвариантное множество А, которо для любого и принад- 
лежит о-полю, порожденному ... ἘΝ 

Определим ΡΙ равенством (10. 3); = силу (10.15) имеем 


Py {M || a eS В Κι} η. Β. 55] 
для каждого n=0, +1,... и для каждого М из «α΄. 
В частности, 
РЕ; Жар ЕН Χπ-1» Ἐπ. BP 
(10.17) 


Поэтому если Т неэргодично относительно P, то существует 
вероятностная мера P; на οἵ, которая отлична от Р, -a6co- 
лютно непрерывна относительно нее и имеет ту же струк- 
туру, что и Р [в смысле (10.17)]. 

Предположим теперь, что Т — неэргодический марковский 
сдвиг относительно Р с матрицей вероятностей перехода П 
и стационарным распределением р. Из (10.17) следует, что Т 
относительно P,; также является марковским сдвигом 
с матрицей вероятностей перехода И. Если ΡῚ отлична от г. 
то сдвиг должен иметь другое стационарное распределение, 


9* 
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Таким образом, Т эргодично, если существует только одно 
стационарное распределение для П; это уже было получено 
в $ 3 другим способом. 


Замечание. Дальнейшие сведения относительно услов- 
ных математических ожиданий см. Дуб [1]. 


‘11. ТЕОРЕМА СХОДИМОСТИ 


Можно задать вопрос, будет ли функция Е{х| 5} при 
изменении & непрерывна в каком-нибудь смысле. Пусть 


#=&4<... и = \/ &, (мы будем обозначать это записью 
n=1 


J, F). В этом параграфе мы покажем, что тогда 


lim Ех 9} =Е{ |9} п. в. 
n> oo + | 


Теорема 


Докажем сначала результат, который служит той же 
цели, что и максимальная эргодическая. теорема. 


Теорема 11.1. Предположим, что функция х интегри- 
руема и 98. .... Тогда для всех положительных A 


Р [зирЕ {1х 119.) >24] 5 Efe). (1.1) 


Доказательство. Достаточно показать, что для 
каждого и справедливо неравенство 


Р| max Е{1= 119) >] < FE {I+}. (11.2) 


15 Е< и | 


Для n=1 sT0—HepaBeHcTBO чебышевского типа, так как 
Е{|х| ||} есть случайная величина с математическим ожи- 
данием E {|x |}. 

Чтобы перейти к общему случаю, рассмотрим множе- 
ство М; (Rk < п) точек ω, для которых Е {|х || 9} < А при [< Е 
и Е {|| Я} ^^. Тогда M,, ..., М» =непересекающиеся мно- 
жества, объединение которых М есть множество, фигури- 
_рующее в (11.2). Если i<k, то функция Е {|х||| 9}, будучи 
измеримой относительно &;, измерима также относительно $, 
(здесь мы используем предположение < &.<...). Так 
как М, определено в терминах E{ ,x|||9;}, где #< А, то оно 
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лежит в &,. Следовательно, 


п n 


aP(M)= У; [лат У | Ε{|α||5}4Ρ-- 


k=1 Мь k=1 Мь 


=) [l<ldP<E{ix)}. 
k=1 M, 


Теорема доказана !). 


В силу непрерывности по А можно заменить знак > 
в (11.1) знаком >. Можно также заменить ЁЕ{|х || 5} на 
| Е {х |9 „} [ или на Е {х | „}, поскольку Е {x || „} < Е {х |9 „} |< 
<E {|x |I] ὅδε}. 


- Теорема 11.2. Если 9, <, το для любой интегрируе- 
мой функции x 


lim E {|| Fp) = E {x ||P} п. в. а) 


и для любого M & FF 
lim Р{М |9Я}=Р{М|] Я} п. в. (11.4) 
n> οο 


Доказательство. Равенство (11.4) является, конечно, 
частным случаем равенства (11.3). Далее, если (11.3) выпол- 
нено для любой интегрируемой и измеримой относительно F 
функции x, TO, даже когда она неизмерима относительно ὁ’, 
это равенство имеет место, если заменить x на E {x ||P}: 


lim E{E{x||FA}||\F,} = EE {x || F}||F} п. в. (11.5) 


Но (11.5) сводится к (11.3) по теореме 10.2: Следовательно, 
можно считать х измеримой относительно 5, и тогда (11.3) 
принимает вид ?) 


lim Е {х |9} =х ци. в. (11.6) 
n-> oo 


Если х измерима относительно какого-нибудь &,, TO 
Е{х |9} =х п. в. для nk, и мы непосредственно полу- 
чаем (11.6). Мы докажем (11.6) для произвольной xX, 


1) Неравенство (11.1) и похожее на него неравенство Колмогорова 
для сумм независимых случайных величин являются частными случаями 
мартингального неравенства. См. Дуб [1]. 

В дальнейшем нам понадобится только (11.4). Однако только что 
предпринятый шаг приводит нас от (11.4) к (11.6) при х, измеримой 
относительно « и, в этом случае, ограниченной. Другими словами, 
используя применяемую технику, доказать (11.4) не легче, чем (11.3). 
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измеримой относительно $, аппроксимируя ее такими случай- 
ными величинами. Для заданного & выберем такую случайную 
величину X,, измеримую относительно некоторого &,„, что Ὁ) 


E{\|x-—x,|}<e. 
Имеем 


SE kel ot eee, | Fa} | + 2sup Е {|x — хь ||| Fp}. (11.7) 


Так как E{x,||7%,}—x, п. Β., TO первое слагаемое в правой 
части неравенства (11.7) стремится к нулю при т, п-> о. 
Следовательно, в силу теоремы 11.1 

2 
P{ fim 1219} E{el ^} ЗЕ — κεἰ} < 5% 
Полагая 8-»0, видим, что вероятность в левой части нера- 
венства равна 0. Таким образом, последовательность 


Е{х |} почти всюду фундаментальна * 
_ Следовательно, предел y= в {x || 7, } существует почти 


всюду. Нам нужно идентифицировать у сх. Предполагая, 
что у интегрируема и интегрирование можно производить 
под знаком предела, получаем 


| ydP=lim | Е {хз аР. - (11.8) 
А НЫ 


Если АЕЯ,, TO [ЕЯ аР= | хаР для всех nk, 
А А 


так что 
| [ уаР= | хаР. 
А 


А 
Но если это равенство имеет место для всех А из =». 


то оно имеет место и для всех А из ὅ, так что в Bae 
измеримости X и у относительно & имеем Y=X п. в. 


1) Это возможно, поскольку х может быть аппроксимирована (в сред- 
нем) ступенчатой функцией, измеримой относительно «&, и каждое MHO- 
жество, связанное с этой ступенчатой функцией, может быть аппро- 


ксимировано множеством из поля U п. 


п 
*) Это рассуждение соответствует первому доказательству эргоди- 
ческой теоремы в $ 2. 
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Следовательно, нужно доказать только интегрируемость у 
и оправдать (11.8) '). Так как в силу леммы Фату 


Дар < lim ПЕ, |dP < lim [Ех ИЯ ЗаР «ΕΕ {γε} 


-n>oo п> oo 


TO у интегрируема. Чтобы установить (11.8), достаточно 
доказать, что | 


lim ПЕ} - ар =0. (11.9) 
п> <> 
Если x,= E {x |9}, Το 


[Ix-yldP< | |x,—yldP+ 
{| *n| <4} 
+ | ЕахИЯдаР+ | Ιν|4Ρ. 
{| *n|> 4} | ый, 
Так как множество {|x,|>A} лежит в &,, то второе сла- 
гаемое в правой части последнего соотношения равно 
|x|dP; полагая а, получаем 

{| nl > ^} : 


fix—yldP< [ Ixn—yldP+ | (Le ltl yap. 
| {]*n |<} Ny ‘ 


Для фиксированного A первое слагаемое в правой части 
при m—> со стремится к 0 в силу теоремы о переходе к пре- 
делу под знаком интеграла. Так Kak Р (№) —>0 при ^—> οὐ 
В си теоремы 11.1, то получаем (11.9) ?). 


Примеры 


со 


Пример 11.1. Если AS] \ A,, где «„#„- конечные поля, 


n=1 


для которых Hehe Sey Gass 6G το 
plim P{A|4,} =I, | (11.10) 
> о. 


1!) Для ограниченной x это очевидно, поэтому (11.4) уже установлено. 
Следующее далее рассуждение соответствует второму из наших доказа- 
тельств эргодической теоремы. 

2) Здесь можно обойтись без ссылки на теорему 11.1, если, не вводя 


множество Ny, заметить, что | (1х УГ) ΒΤ О равномерно 
> со 


| {1х1 > 4} 
по п. — Прим. ред. 
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(сходимость по вероятности). Этот . сильно ослабленный 
вариант равенства (11.4) можно доказать непосредственно 
с помощью энтропии. Если «- конечное поле с атомами 
Аи A‘, то, как показывает теорема 7.1, H(A|A,) 0. Но 
Н (A | Ap) есть математическое ожидание величины 


п (Р {А |„}) + ч(Р{А || And), 


которая сходится, таким образом, по вероятности. к нулю. 
Так как функция y(t) равна нулю только в точках 0 и 1, то 


P{E<P{Al| An} < 1 — 8} 0. 
Но > 
Р(АП{Р{А14,}<:))= [ РА }dP-<e. 


{P {A ll 4n} <} 
Из этих двух соотношений вытекает, что’ 
P(AN{P {All An} < 1-8) «96 
для больших и. Аналогично 
(ASP {AP || An} <1-8}) < 28 
! для больших п. Теперь легко получаем соотношение (11. 10). 


Пример 11.2. Пусть Р — мера Лебега на классе οἵ. 
борелевских множеств в © = [0, 1) и &,„-— конечные поля, 
имеющие атомами диадические интервалы [( — 1)/2", k/2”) 
ранга n. Тогда ὅῃ]οξ,, так что, если х (0) измерима по 
Борелю и интегрируема по `Лебегу, _ то E {x||7,}—> x п. B. 


Вариантом величины Ε {x || 9 является | x (a) do’ Po 
Uy, (@) 
Trae u,(o)— диадический. ‘интервал ранга п, содержащий о. 
Takum образом, 
1 | 
о-в [ ай 
Uy (ὢ) 
_ для почти всех ©. if CNBISET AY это основная теорема 
исчисления. 


Пример 11.3. Пусть {х }— координатные величины, со-. 
ответствующие сдвигу с пространством состояний р. Если 
Pn, есть о-поле, порожденное величинами Х-и, ..., X-1, Ἡ 
Ὁ — поле, порожденное ..., Χο, ху, то ὅλῃ], так что 
в силу теоремы 11.2 | | | 


im ΡΕ =a ИЕ а hg о И SE eB 
ΠΡ ος. 
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Если {x,}— марковская цепь, то это равенство очевидно 
в силу (9.8) и (9.9). | | 


Пример 11.4. Теорема 11.2 вновь приводит нас к кри- 
терию эргодичности для марковского сдвига. Покажем сна- 
чала, что если множество А инвариантно, то P(A+ М) =0 
для некоторого М, лежащего во всех о-полях οἵ ,, где F » 
‚ порождено хи, Χπη» .... В самом деле, А может быть аппрок- 
симировано (в смысле малости симметрической разности) 
цилиндром Е. Но ΤΕ аппроксимирует Т"А=Аи TE 
принадлежит οἵ ,, если т достаточно велико. Таким обра- 
зом, А может быть аппроксимировано элементами из of »p. 
Отсюда легко следует, что P(A+B,)=0_ для некоторого B, 


Из с „. Возьмем М равным, скажем, lim В». 


Так как М лежит в οἵ ni, TO из ела обобщения 
равенства (9.13) вытекает, что 


P{M |. . Ξ Xn-1s Xn} = P {M||x,} Π. В. 


Так как P(A+M)=0, то А и М имеют равные почти ΞΘΘΝ 
условные вероятности и, следовательно, 


PIA: Sata} = PAA п. 8. 


Так как σΠΟΠΗ &,„, порожденные последовательностями 
..., πον Хи, удовлетворяют соотношению 6η) οἵ, где οἵ — 
полное о-поле, порожденное всеми координатными величи- 
нами, то теорема 11.2 дает теперь 


lim Р {Ах} =1[4д 1. в. 
п> oo 


Таким образом, та: | 
ἜΒ P{|P {Allxa} — 14|» 8} = 0. (11.11) 


B силу (10.6) и того, что A инвариантно, имеем 
-. Р{АЙжвидь = РЕА Жить: 
И, опять-таки в силу инвариантности A, имеем J,(@) = 
=1[,(To). Следовательно, если H, есть множество, вероят- 


ность которого фигурирует в (11.11), то ΤΗ, = Ημ. Так 
‚ как Г сохраняет. Ρ, то эта вероятность равна 0 для всех п. 
Таким образом, 


PLANS} =I a in: 8. 


Следовательно, существует такой цилиндр В, зависящий 
только от координаты ху, что Р (А+ В) =0. Таким образом, 
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Т эргодично тогда и только тогда, когда не существует 
такого, цилиндра В, что P(B+T'B)=0 WO <P (ВЕ. 
Это сразу приводит к критерию эргодичности из $ 3: T 
эргодично тогда и только тогда, когда матрица вероят- 
ностей перехода ЦП неприводима (в предположении, что все 
стационарные вероятности р; положительны). Этот вывод 
обладает тем преимуществом, что он проходит даже в слу- 
чае, когда пространство состояний ϱ He дискретно (см. 


Дуб [1]). 


Убывающие σ-ποπη κ 
Eon 2, Ooo OS ие то 
а x EB, 


Любая последовательность интегрируемых случайных Be- 
личин, удовлетворяющих этому соотношению, называется 
мартингалом. Дубу принадлежит известная теорема о схо- 
димости мартингалов почти всюду, которая содержит тео- 
рему 11.2 в качестве частного случая. 


Предположим теперь, что FY,D FD... и “= Я. 
-=1 


(обозначаем это записью &,„19). Следующий результат 
также вытекает из теоремы Дуба. | 


Если F,\ 7, то | 
Ва ΕἸ} “πβ΄ (11.12) 
n->co 


для любой интегрируемой функции x и 
lim P{M||7,}=P{M||F} › п: в. (11.13) 
п> oo 


Мы не будем доказывать этот результат, но проиллюст- 
рируем его, используя для доказательства перемешивающего | 
свойства любого. колмогоровского сдвига. 

`Напомним (см. $ 8), что Т является сдвигом Колмого- 


со 
рова, если каждое множество из 0-поля οἵ „ = П οἵ „ (где 
n=l  . 
oF „ порождено координатными величинами Χμ, Хин, ...) 
имеет меру либо 0, либо 1. Для того чтобы’ доказать, что‘ 
преобразование Т перемешивающее, достаточно в силу тео- 
ремы 1.2 показать, что 


lim Р(АП TB) =P(A)P(B), (11.14) 
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если только В — цилиндр. Не ограничивая общности, будем 
‘предполагать, что В зависит только от неотрицательных 


координат, а в этом случае Т"В е « „ для всех п. Так как 


< nb o, то в силу (11.13) | 
! lim Ρ{Α|6᾽ „} = РАЙ“ ὦ Π. Β. 
Так как любое множество из οἵ „ имеет меру либо 0, 
либо 1, то Р{А|‹«Я „}=Р(А) п. в., так что 
А, =Р{А|< „}—Р(А)—>0 п.в. 
Но, так как T "BG ¥ „, то 


|Р(АПТ"В) — Р(А)Р(В)|=| | А,ар 


TBS 


SE {An |}. 


Так как |A,|<2, то E{|A,|}—0, что доказывает (11.14). 

В конце $ 4, посвященного непрерывным дробям, было. 

показано, что если SY, есть о-поле, порожденное a, (в), 
со 


К д Π Fn содержит лишь множества меры 
n=1 

0 или 1. Только что приведенное рассуждение доказывает 
также, очевидно, и TO, что преобразование, рассматриваемое 
в $ 4, является перемешивающим. 

Доказательство того, что &.„, тривиально, содержащееся 
в $ 4, опирается только на соотношение (4.15). Это легко 
приводит к следующему критерию. Предположим, что T— 
сдвиг, обладающий тем свойством, что существует такая 
положительная константа С, что 


— P (B) <P (B\A) < СР(В) (11.15) 


для цилиндров | 
Е, 
ал. 


re т<п<и<о. Тогда преобразование Т является сдви- 
гом Колмогорова и, следовательно, обладает свойством 
перемешивания '). ! | 


(11.16) 


\ 

1) Тривиальность с-поля &%,, вытекает уже из одного левого нера- 
венства (11.15). Если же выполнено только правое неравенство, то най- 
дется такое конечное поле σέ, что любое множество из «„» отличается 
OT некоторого множества из ‹ на множество меры 0. Так обстоит, на- 
пример, дело в случае марковского сдвига, — Прим. ред. 
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Если Т-— сдвиг Маркова, соответствующий матрице 
вероятностей перехода П с положительными элементами, то 
(11.15), разумеется, выполнено. Если матрица НП неприво- 
дима и апериодична, то существует такое натуральное число R, 


что П* имеет только положительные элементы. В этом случае 
(11.15) выполнено, если в (11.16) uw-n>k, и нетрудно 
видеть, что наше доказательство по-прежнему проходит. 
Таким образом, мы получаем еще одно доказательство того, 
-что сдвиг Маркова с неприводимой апериодической матри- 
цей вероятностей перехода является сдвигом Колмогорова 
и, следовательно, перемешивающим. 


Замечание. Соотношение [11.4] принадлежит Леви [2]. 
Теорию мартингалов см. в книге Дуба [1]. 


4 


ГЛАВА 4 
Сходимость энтропии 


12. ОБОБЩЕНИЕ УСЛОВНОЙ ЭНТРОПИИ !) 


Определение 


Если A — конечное Е ΠΟΠΗ oF , a & — его б-подполе, . 
ТО ПОЛОЖИМ 
H(A|F) = Е} Un(P {All 9) |, (12.1) 


где сумма. берется по всем атомам поля uf, a ἢ опре-. 
деляется, как обычно, соотношением (5.11). В случае когда & 
конечно, величина (12.1), которую мы будем называть 
условной энтропией поля vf при заданном &, сводится 
к выражению (6.1), использованному в гл. 2. 

Тихе выбирает точку ® в соответствии с распределе- 
нием Р и сообщает экспериментатору, какие элементы поля & 
содержат о, а какие, нет. В соответствии с эвристическими. 
рассуждениями предыдущей главы Р{А|57} есть новая ве- 


роятность множества А, так что энтропия Σ n(P {All| F}) 


является мерой остающейся неуверенности sroneoymenTaropa 
относительно исхода с. Величина H(A|FZ) дает среднее 
значение этой остающейся неуверенности. Можно рассмат- 
ривать $ как сложный эксперимент. Если экспериментатор 
знает исход $, TO он все же до некоторой степени неуверен. 
в исходе σέ и получает некоторую дополнительную инфор- 
мацию, когда узнает исход σέ. Остающаяся неуверенность 
и эта дополнительная информация измеряются одной и. 
той же величиной Н (|9). 

Эта величина имеет другую форму: 


СР” ВА РА 99) 


Правая часть этого равенства в силу те 10.1 равна 
(вспомним, что Е {E {x||7}} = Е {x}) 


Е] Е} — Xlaln РЗАЛ НЯ || = 
=Е] — Е {1419 шР{415 = H(AID). 


1) Читатель может опустить этот параграф, если согласится пред- 
полагать некоторые сдвиги в последующих параграфах марковскими, 


— 
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_ Свойства функции Н (49) 


Это расширенное понятие условной. энтропии обладает 
теми же свойствами, что и ранее рассмотренное: 


(С) H(AV @\A)=H(A|\A\+H(IAV ὅλ). 
(С.) H(A\A<H(#lP), если ACH. = 
(C3) H(A\P,)<H(A|Y,), если 8,5 8». 
(Ο) H(AV B\P)<H(A|S) + Η (AY). 
(Ca НТ TPF) = Ни. 


Докажем (С), (Οἱ и (С.), остальное получается, как раньше. 
Согласно (10.11), имеем 


Ρ{ΒΠΑΙ 6 
PIBIAV A= У πα, (19.3) 
A : 


где суммирование распространяется на атомы поля A. Для. 
любой точки ὦ все слагаемые в (12.3), кроме ‘одного, обра- 
щаются в нуль. Поэтому 


InP{BIAV B= Main а п.в. (12.4) 
А 


Но 
У, Jane ШР{АП BIS} = 
А, В 


В 
= У, 1 in P{AIS} + Ἂ Lal = 
A,B. A,B 


= УР (Al) + Δι!» ΙπΡ{Β|2έν 8). 


Взяв математическое ожидание ‘и применив (12.2), по- 
лучим (С)). 

‚ Для доказательства {С.) используем неравенство Иенсена 
(10.10). Пусть х=Р{А| 5}. Так как функция η выпукла, то 


Е {n(x)|| Fo} < η (Ε {x||F,}) =" (Р {Α||450}), 


где равенство вытекает из теоремы 10.2. Переходя к мате- 
‚ матическим ожиданиям в обеих частях неравенства, получаем 


Ein(P {4 15}}} < -Ε{η(Ρ{Α[9). 
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Суммирование по всем атомам поля ‹ дает (С.). Это рас- 
суждение в скрытой форме повторяет доказательство свой- 
ства (А.) из $ 6. 

Из (10.6) вытекает 


п(Р {TAIT SF) ,) = п(Р {All Aro). 
Интегрируя, получаем 
Ε {η(Ρ (Т'А|Т"9}} = Е {и(Р {AIP}, 


_а суммирование по атомам поля «4 дает (C;). 
Рассмотрим о-поля FS, и Я 


Теорема 12.1. Если &,„^ Я, то 
lim H(A|F,)= H(A|F). 


Доказательство. В силу теоремы 11.2 
lim Р{А|9„}=Р{А|9Я} п. в. 
п> о 
Так как функция y(t) непрерывна и ограничена, то утвер- 
ждение теоремы следует из определения 12.8: 


Можно использовать теорему 12.1 для нового доказа-_ 
тельства теоремы 7.1, представляющей основополагающий 
результат Колмогорова. Центральный этап этого дока- 
зательства состоит в доказательстве того, что если ко- 
нечные поля An удовлетворяют требованию 4,CcC 4,.C 


и AS ν An, TO lim H (| 4) = Ξ0. В силу теоремы 12.1 и 
свойства το) 


lim H(A|A,) =H παν 
n-> oo 


ty) < <H(A|\A)= 


Сравните это с примером 11.1. 
Из теоремы 12.1 и свойства (B,) из $ 6 следует 


h(A, n= H(A ν r'A). (12.8) 
Аналогично если Т обратимо, то 
h(A, T) = a(t Vv πα) ! | (13.6) 


В 8 6 мы интерпретировали h(A, T) Kak приближенное KO- 
личество информации, извлекаемой при проведении экспе- 
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_римента 4, если известны результаты большой, но конечной 
серии предыдущих проведений этого эксперимента. Геперь 
можно интерпретировать эту величину как точное значение 
количества информации, полученное от проведения экспе- 
римента, при условии, что известна вся предыстория. 


_ Две специальные формулы ') 
_ Введем обозначения A = -ν τ! ge Е rig. 
= i=] 


Ἐ еорема 12.2. Пусть преобразование T обратимо. Если 
либо # CA, либо AC GZ, то 


lim — L(V, T*A| # \=H (A| A). ; (12.7) 


п> о П 


Доказательство. Рассмотрим сначала случай GCA. 
В силу свойства (Οι) (обобщенного по индукции) и (Οι) ~ 


i=0 


n-l n—1 : ; 
ну г’ я“)-1 ΠΤΙ νντία]- 
k=0 = 


fel — \ 
=< a(t ae ta νν TA) = 
k=0 3 - 


-1¥ H(AITIAV «0. УТУ ТЯ УТУ...) 


~ 


Если # <= Л, то теорема 12.1 дает 


lim H(AIT A у... У ТУТ vy ...)=H (#1 A). 


AOE (12.7) следует из теоремы о средних арифметических. 
Рассмотрим случай ας 4. Так как 4A ς.Φ, To 
в силу (С.) и первого случая (при £= 9) имеем | 


n—l 
lim — L(V TA # | <lim LalV TA =)- Н (A| #). 
n->oo П | i -> 00 k=0 ΓΕ, (3. 8) 


= ние два результата этого параграфа используются только 
при доказательстве теоремы 17.3. Возможно, лучше будет вернуться к ним 
еще раз, когда они понадобятся. 
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С другой стороны, используя поочередно (Οι), (Οἱ и (C)), 
каждый раз применяя первый случай, получаем 


п-1 
fin 11(V ги!) 
п> 00 k=0 
п-1 
lim ΕΝ Τ᾽ Φ| @ -)- - "ς T'@ 
п, 8—0 п 


п> о 


ταν σα)» 


у. 
I 


> H (P| #)— lim L(Vireg 
п> о k=0 


ῃ--] 
= lim ну ная 
Е 5 k=0 


n-> oo 


=lim — L(V, ги) H(A| 4). 


n-> οο @ 


Это вместе с (12.8) дает (12.7). 
‚< Теорема 12.3. Если преобразование Т обратимо, то 


HAV GIANG) =H ALL у Ν rg) + (91) 
‘Доказательство. Теорема 12.1 дает με. 


jim H(A уз у ν τ'σ]- ΠΕΙ νν τιφὶ (12.9) | 
В силу (Οὐ и (C;) | | 

a(V PALA V EV ν Tig] = 

Sa (rh AN BN Vig ν' У TA) = 


| 
5 
| 


5 5 
ΓΣ 
-- 


κ ΟΝ 
πίαι.εν VEN V ТЗ )- 


a 
| 


| 


ᾱ--ἱ 
alae VB Vine) 


a 
[ 


Отсюда, из (12.9) и теоремы о средних арифметических | 
следует | 

lim = н(У ТУ $ У ν ут) -н (ау τ ν τὶ 2). 
п> < i=—0o 


1) Е 1491 
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С другой стороны, в силу (C;) и двукратного применения 
предыдущей теоремы (сначала с AV % вместо Au $, 
а затем с вместо 4 и ХУ # вместо.) имеем 


а Е pal 
lim L(V T'A| AV B® VN rg) = 
п> οο 4 k=0 : k=0 
n=l п-—1 
= lim 1н(У rAVV Т'® У я) - 
п > oo k=0 k=0 
a1 
-LalV 79| 4 У σὴ]- 
=H(AV B\A ν Φ)-Ἡ(Θ 6). 


Замечание. Теоремы 12.2 и 12.3 принадлежат Рохлину 
и Синаю [1]. 
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Если Т — общий сдвиг (пример 1.2) с пространством со- 
стояний о, а Н (xo, ..., х,_1) обозначает энтропию конечного 
поля, имеющего своими атомами Г” множеств (г есть объем 
_ множества 0) вида {© : Χρ(ω) -- ἰῳ, ..., Xp-1(@) =1_1}, то в силу 
теоремы Колмогорова 


ЕН к ар 
п>® М. 


Напомним, что (13.1) — теорема, a не shh a RO 

Для любой последовательности (1, ..., ἴῃ.) элементов из о 
положим Pig, ..., и) =Р{ж=4, ..., Е Тогда 
р (хо (©), ..., Х„-1(9)) есть вероятность фактически наблю- 
даемой последовательности (ху (®),..., X,-;(@)). Так как 
— шр(хо (©),..., X,-1(@)) имеет математическое ожидание, 
равное Н (Χρ, ..., Χη-ι), то из (13.1) следует 


Jim Е] == In p (xo (0), ess Sai (0)) += h (7). (13.2) 


n> oo 


Результат 


В эргодическом случае в соответствии со следующей 
теоремой, последовательно усиливаемые варианты которой 
принадлежат Шеннону, Макмиллану и Брейману, величина, 
стоящая под знаком математического ожидания в COOTHO- 
шении (13.2), сходится к A(T) почти всюду. Для больших n 
вероятность р (ху (0),..., Хх, (0)) наблюдаемой последова- 
тельности должна быть близка к е`"* (1, 
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Теорема 13.1. Если Т- эргодический сдвиг, то 


lim {—— In р (% (6), ...› жи (0) $=A(T) п. в. (13.3) 

п> οο 
Доказательство. Разберем сначала два поучитель- 
ных частных случая. Если Т — сдвиг Бернулли (ру, ..., р,), 


TO р (ig, ee 09 г) τες Pi, eee Pi,» так ΠΤΟ 


п! 


, on 1 
— — In p (xo (@), wees Xn-1(@)) = а МР, (oy 


Из эргодической теоремы, которая в этом случае сводится 
к усиленному закону больших чисел. для испытаний Бер- 
нулли, следует, что левая часть этого равенства сходится 


почти всюду к Е | In Bias = — Ур, Inp,=A(7). 
i 
Если Т- эргодический сдвиг Маркова, порожденнный 


начальными вероятностями р; и вероятностями перехода Pi; 
TO 


-- In p (x (6), es Χπ-ι (6)) = 


= 

So Εμ ΕΝ 1 п ae In 

eer ae Ce 2 Px, ©), xp)" 
k=l 


Соотношение (13.3) получается и в этом частном случае после 
применения эргодической теоремы. 

Доказательство в общем случае опирается на эргодиче- 
скую теорему и теорему 11.2 о сходимости условных вероят- 
ностей. Мы будем использовать функции | 


о (6) = — In p (xo (o)), 


— 4, P (Я (©), ..-5 ¥-1(@), Xo (0) 
8k (ὦ) 23 Е p (Xz (©), ...› XK] (@)) ? 
(i) (en) =z — | В (Xe (©), ..., κ-ι (ὦ), ἢ 
ip (©) ND ak Oh es х—1 (@)) 


Заметим, что /\(@) есть взятый с обратным знаком лога- 
рифм величины 

Реле co 34 xe 
Заметим также, что все эти функции HEOTPHMWATE::.i... 


Непосредственное вычисление показывает, что 
п-1 


2 In p(%(0), ..., X10) =; У вь (7). (18.4) 
k=0 | | 


Если бы функция σµ(ω) не зависела от k, то правая часть 
равенства (13.4) имела бы вид среднего, к которому приме- 


10* 
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няется эргодическая теорема, и мы получили бы (13.3). 
Хотя, вообще говоря, g,(@) зависит от К, мы покажем, 
используя теорему (11.2), что g,(@) сходится к некоторой 
функции 5 (6) при k->oo. После этого идея. доказательства 
заключается в том, чтобы проверить, что среднее в (13.4) 
т] 
| eee г 
близко к — У g (T*a). (Бернуллиевский случай разбирается 
| k=0 
просто, поскольку для всех неотрицательных А функции 
2» (©) совпадают со своим пределом β(ω). Марковский случай 
прост, Tak как д, (©) = & (©) для положительных R.) 

В силу теоремы 11.2 P{xy=i||x_,,..., ¥-y} сходится почти. 
всюду к | | 
Р{хо=й| 94499 Χο; х_1}. 

Из непрерывности логарифма следует, что f (ω) сходится 
п. в. (предел может быть равен + 00), Так как с, (©) совпа- 

дает с [2 (ὦ) на цилиндре {® : хо (®) =i}, то предел 
g (ω) = lim g; (©) (13.5) 

Е -> © 

существует п.в. Так как функции βµ(ὠ) неотрицательны, 
TO g(@) также неотрицательна, HO то, что мы пока знаем, 
не противоречит предположению о том, что на множестве 


положительной меры она может равняться + ov, 
Покажем теперь, что 


ΒΕ { sup в» (®) | < <. (13.6) 
_В частности, получим, что в (6) интегрируема и, следова- 
тельно, конечна п. в. Если 
E,=Jo: ! 
р ts mex 2) OS 4 < ea (0), 
TO | 
P(E) = ХР ({%=В ПЕ.) = BP (m= N Fe) 
Sa (i 
Fo = Го: (i) (i) 
вы: (©). 
(i) 


Так как Рь принадлежит с-полю, порожденному величинами 
Х-ь, озу Х-1, то р 


Ρ({χο-- } ῃ Fe) = [РИ eS x. dP = 
pie) : . | 
= fok @ -λ р ( pid) 
= fe ©? do) <e*P (FP). 
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Так как Fy при различных # не пересекаются, TO 
DPE) < Хе" SP Ee) τε" 


где г— объем множества о. Следовательно, 
Р { sup 8% (©) Е: = = ге“. 


откуда следует (13.6). Таким образом, g интегрируема. 
Интегрирование соотношения (13. 4) и замена переменной 


дают 
Е {5} = lim Е {g,}= lim Е | LF g(r) | =h(T). 
| k>o n->oo = 


Запишем 
п-1 п-1 а n—-l 
1 
- У вк (T'o) == Ура (To) +— У (в (T*o) -- g (T*a)). (13.7) 
k=0 k=0 ----0 


Πο νο о (вспомним, что Т эргодично) 
Jim 1+ Yet = E(g)=h(7) п. B. (13.8) 
Если Gy (0) = sup (o) - (о) | то для любого № 


Jim гу (Te) — Е -({Ρο}|-- 


-ᾱ--ο. 
n—-l 


< lim ee —g(T*o)|< 


n-l 


=. Пи, — ‚5 Gy(T*e)= E{Gy} п. в. 


Но @ м (6) сходится к нулю почти всюду и мажорируется интег- 
рируемой Функций g (6) + sup Lr (0), так что. tite E{Gy}=0. 
Значит, вторая сумма в правой части Ата (13. 7) стре- 
мится к нулю почти всюду, что вместе с (13.8) дает 
И!’ 

lim = re h(T) п. в. 

г мк ah | ye 
Теперь (13.3) следует μ8 ud 4), uTO завершает ‘доказательство 
теоремы. — | я 


+ 4 


¢ 
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Другие варианты теоремы 


Если Т не обязательно эргодично, то (13.8) нужно заме- 
нить соотношением 


п-1 
; 1 ж 
itn и с (Т o) = g(a) fe: 


где δ — инвариантная функция со средним значением E {5} = 
= й(Т). Аналогично следующее за (13.8) неравенство должно 
быть заменено неравенством 


п > © 


п—1 | 
lim > (g,(T*o) — в (T*o))|< Gy () п. B., 
k=0 


где теперь Gy () = sup | ge (0) -- β (®)| и E{Gy}= E{Gy}. 


Левая часть этого неравенства превосходит A с вероятно- 
стью, не превосходящей E{G,}/A. Полагая Ν-»οο, λ-»0,. 
получаем, что она равна 0 почти всюду. Отсюда следует, 
что | | 2 

a 1 2 

lim {-- bn ix) sey ()) t= 8 (6) п. В. 

п> οο 
Если Т эргодично, то мы снова приходим к (13.3). 

Теорема 13.1 сохраняет силу и для одностороннего. 

сдвига 7. Если задан односторонний эргодический сдвиг Г, 


то построим двусторонний сдвиг Т с теми же конечномер- 
ными мерами. Так как эргодичность связана только с конеч- 


номерными мерами, то Т также эргодичен. Отображение, 
‚ переводящее бесконечную в обе стороны последовательность 
(..., @-1, @, ©, ...) в последовательность (Ωρ, @, .. .), пере- 
водит соотношение (13.3) для сдвига Τ᾽ в соответствующее 
соотношение для ТГ. Таким образом, теорема 13.1 выполнена 
и для односторонних сдвигов. 

Из теоремы 13.1 для одностороннего сдвига можно 
вывести более общий на вид результат. Пусть. Т — произ- 
вольное эргодическое, сохраняющее меру преобразование на 
вероятностном пространстве (©, ο, Ρ), а Ж- конечное под- 


поле поля cf. Если р, (®)— вероятность того атома поля 
п-1 

-β и : 
ν TA, который содержит ὦ, то 


k=0 


lim 1 In р» (o) }=h(A, 1) п. 5... (13.9). 


n> οο 
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[Бели \/ T'A=F, то h(A, Т) можно отождествить с n(n). 
k=0 


Поэтому нужно только перенести задачу Ha пространство 
односторонних последовательностей с помощью отображе- 
ния ®-> (7 (6), [(Го), ...), где [— некоторая функция, при- 
нимающая различные значения на разных атомах поля ο΄. 
С помощью (13.9) можно, полагая ο полем событий, наблю- 
даемых в момент времени 0, снова прийти к теореме 13.1. 

Аналогичный результат имеет место, если vf заменить 
σ-ΠΟΠΕΜ, соответствующим счетному (а не конечному) οὔ -раз- 
биению пространства ®. с р» (0) — по-прежнему вероят- 

oe 


—Р ὦ 
ность того атома поля Ἣν Τ᾽, который содержит ®, и 
k=0 


Ν T*A=F, το 
lim | Gln р» (o)} = А(Т) гв.) 


n> co 

Отсюда следует, например, что преобразование, связанное 
с непрерывными дробями, имеет энтропию 17/6 ш2 (см. (4.22)). 

Теорема Шеннона — Макмиллана — Бреймана связана 
с условиями Липшица, которым удовлетворяют некоторые 
функции распределения на единичном интервале. Возьмем 
в качестве Т преобразование То = го (тоа 1) на полуинтер- 
pane [0, 1] (пример 3.5), и пусть Р— мера, сохраняемая 
`° преобразованием Т. Пусть οί -— конечное поле с атомами 
[i/r, i+ l/r), i=0, 1,..., r—1. В этом случае ри (о) есть 
Р-мера того г-адического интервала и„ (6) ранга п, который 
‘содержит ©. Если Г ΡΘΕ относительно Ρ, то из (13.9) 


k=0 
жеетв, вытекает, что 


-k 
и того, что \/ Т “A есть σ-ποπε οἵ всех борелевских мно- 


In ри (ὦ) й (Т) (13.10) 


с точностью до множества Р-меры 0. Если (13. 10) выпол- 
няется в точке @, то. 


ρα (ω). (в) | со, если a> а ἢ 
Не (18.11) 
п {{Π| | 0, если a< ae 

nr 


1) Доказательство см. в работе Чжун Кай-лая [1]. 
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Если F(x)=P[0, x), то р„(®) равно приращению функции 
распределения F на интервале и, (). Так как этот интервал 
имеет длину Г”, то (13.11) означает, что Е удовлетворяет 
условию Липшица в точности порядка A(T)/Inr в точке о. 
Таким образом, F удовлетворяет условию Липшица в точ- 
ности порядка h(T)/Inr на множестве Р-меры 1. (В $ 3 οτ- 
мечалось, что Е сингулярна, если только не имеет места 
тождество Р(х)==х, в последнем случае й (Т)Лпг = 1.) Уста- 
новить условие Липшица для F на множестве лебеговой 
меры | представляется затруднительным. 


Свойство равнораспределенности 


Пусть Г-снова двусторонний сдвиг. Для любого нату- 
рального b отображение ®-> (х! (©), ..., Хь(©)) индуцирует 


вероятностную меру на множестве о’ упорядоченных групп 
из 6 элементов пространства о. причем вероятность такой 
упорядоченной группы и = (4, ..., ip) равна 


р (и) =P (κι, Е, Χο) = и} =Р (Хин, ce Хиль) = И}. 


Согласно теореме 13.2, при больших 6 множество о? раз- 
лагается на два подмножества, из которых одно имеет малую 
общую вероятность, а другое состоит из упорядоченных 
групп по 6 элементов, таких, что вероятность каждой группы 
близка к ее?" (7) — факт, известный под названием свойства 
асимптотической равнораспределенности. 


Теорема 13.2. Пусть Т- эргодический сдвиг с энтро- 
пией В. Тогда для любого => 0 существует такое натураль- 


a b 
Hoe число δῃ(6), что о’ при В >, () разлагается на два 
множества Н u L со свойствами: 


1) Σ ρ()-Ρ{αν ..., де} <ь, 
2) е-Ъ (+9 < р(и)=Р{(ь ..., х)=и}<е- 4-9, если ЕН. 


Доказательство. Перейдя в (12.3 к пределу по 
_ вероятности, получим 


| | | 
р lim | - у шр(х у xp(o))}=h. 
δ -»οο ; é ! ; 
Выберем такое bo (=), что 


Ро: |--; пр(з (®), ..., а 
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при 6 >> 6, (г). Пусть Н (группа высокой вероятности) состоит 
из тех упорядоченных групп и по В элементов, для которых 


—< In p(u)—h\<e, 


и пусть L (группа к вероятности} является дополнением 


множества Н в 0”. Ясно, что Н и Г, обладают требуемыми 
свойствами. 


Замечание. Исходные работы в этой области при- 
‘надлежат Шеннону [1], Макмиллану [1] и Брейману [1]: 
Другое доказательство теоремы 13.2 см. в работе Тома- 
сяна [1]. 


> 
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Классическое определение 


В 1919 г. Хаусдорфом было введено понятие размерности, 
которое, как оказалось, имеет любопытную связь с энтропией. 

Пусть М — множество в метрическом пространстве, скажем 
в евклидовом. Внешняя мера (М) (а-мерная) определяется 
для положительного & следующим образом. Назовем р-покры- 
тием множества М счетное покрытие этого множества замк- 
нутыми, ‘шарами $5; диаметра, меньшего Ρ. Положим 


1, (M, ϱ) = int У (диам. A Е ae 


где нижняя грань берется по всем б-покрытиям множества М. 
При убывании о нижняя грань в (14.1) распространяется на 
все меньший класс покрытий и, следовательно, (М, ϱ) Βοβ- 
растает или, во всяком случае, не убывает. Поэтому предел 
(конечный или бесконечный) 


(М) = lim 1, (M, о) 
р>0 


существует. 
Ясно, что функция [(.) монотонна: (М) < (М), если 
ММ’. Для заданной последовательности множеств Mn 


выбираем такие р-покрытия {S,,}, что У (диам. 5) < 
| 


<14(M,, о) + ε/2" -- [α(Λ4ῃ) + 2/2”. Все шары 5»; вместе обра- 


а 
зуют о-покрытие множества (м, причем > (диам. S53) κε 
Was in 


<)> 1,(M,) + в. Следовательно, функция Ια(’) полуаддитивна: 
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«(О м,)< 4 (Мь». Таким образом, /,(M) как функция. 


от М является внешней мерой. 

Хаусдорфова размерность множества М определяется 
поведением /,(M) не как функции от М, а как функции OT а. 
Покажем, что если (М) конечно, то la (M)=0 для любого 
а > а. Если {$} — некоторое о-покрытие множества М, для 
которого _ 


Σ (диам. 5)" < (М, ϱ) -- 1 «-1α(Μ) +1=К<о, 


- 


το (М; 0) < >, (диам. Ss oo У (ana, еек. 


Так как a >a, το. полагая ϱ-»0, получаем ly (М) =0. Если 
[ (М) конечна пля некоторого конкретного значения α, то 
} 


Рис. 4. 


она равна нулю для всех больших значений. Следовательно, 
существует „точка перехода“ — такая точка αρ, что 4, (М) = со 

для a<d и 1 (М) =0 для. a>, (рис. 4). Функция 1, (M) 
_в точке а может равняться нулю, принимать конечное поло- 
жительное значение или со. (Крайние случаи = 0 (/,(M)=0 
для всех а>0) и и =с< (1, (М) = со для всех а>0) могут 
иметь место, хотя в евклидовом пространстве второй случай 
невозможен.) Однозначно определяемое число αρ и есть хаус- 
дорфова размерность множества М, мы ее обозначаем dim М. 

Имеем 


dim М = sup ία: da OM не Bk te: I,(M) =0}.. 


Мы постоянно используем следующие четыре факта: 
(М) >05 dim M Sa; 2) dimM >a, ie со; 3) 1,(M)< 
<osdimM<a; 4) т М<9= 4 (М) =0. 
Отметим два основных свойства хаусдорфовой размер- 
ности. Прежде всего, она, очевидно, монотонна: 


dim М < dim ΛΙ’, (14.2) 
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если M <M’. Во-вторых, 


dinUM,=supdimM,. | (14.3) 
n п 


Действительно, если dimM,<a@ для всех и, то /,(M,)=0 
в силу полуаддитивности функции ἰα(») имеем 1 (U M ἧτο 


и, следовательно, dim М, < a. Таким образом, dim (] м, -- 


= =. dim Мы. Обратное неравенство очевидным образом сле- 


дует из (14.2). 

Для оправдания хаусдорфова определения покажем, что 
размерность достаточно гладкой поверхности в трехмерном 
пространстве равна 2. Итак, предположим, что поверхность М 
определяется уравнением = =[(х, и) над единичным квадра- 
том на плоскости. Без всяких дальнейших предположений 
можно доказать, что апп М >2. Для этого будем считать, 
что М покрыто шарами $; диаметра 4;. Если р — вертикаль- 
ная проекция на плоскость (x, y), то pS; покрывают pM. 
Так Kak pS; есть круг диаметра 4, (с площадью ла? |4), a pM 


есть единичный квадрат (с площадью 1), то > ndi/4 > 1, или 


У (диам. S;)? > 4/n. Таким образом, 1, (М) > 0, так что 


$ 
dim M ::32. 
Обратное неравенство можно доказать, если предполо- 
жить выполненным условие Липшица o; (6) = O (δ), где 


о; (6) = зир {11 (х, ИЕ, Их" |556, ly-y' |< 8} 


есть модуль непрерывности функции Г. Из этого условия 
следует непрерывность [; с другой стороны, если, например, Ϊ 
непрерывна и имеет ограниченные частные производные, TO 
это условие выполнено. Докажем, что Чт М <2, показав, 
что [. (М)=0 при любом e>0. Выберем Και так, что 
©; (6) < Кб. Разобъем теперь единичный квадрат на 7? малень- 
ких квадратов со сторонами, равными 1/й. Так как вариация 
функции f на любом из этих маленьких квадратов меньше, 
чем K/n, то часть поверхности М, лежащая над таким 
маленьким квадратом, может быть заключена в куб с реб- 
ром K/n, который в свою очередь может быть заключен 


в шар диаметра УЗК/и. Таким образом, поверхность М 
может быть покрыта и? шарами диаметра V3 K/n. Для этого 
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покрытия имеем >, (диам. Sy =(V3K) |r’. Выбирая п 
i 


так, что V3K/n<p, получаем 
[не (М, 9) < (УЗ К) [и 


и, полагая п-> соо, имеем ἴοιε(Μ, 0) =0. Таким образом, 
love (M) = 0, так что dimM< 2. 

Такое рассуждение показывает, что хорошие множества 
имеют именно ту размерность, которую и следует ожидать. 
Далее мы не будем заниматься подобными рассмотрениями, 
так как нас будут интересовать крайне нерегулярные мно- 
жества, размерность которых не есть целое число. 


Размерность в единичном интервале 


Далее множество М будет подмножеством единичного 
интервала. Нетрудно видеть, что для такого множества 1 (М) 
есть обычная внешняя мера, так что 11 (М) < 1. Таким обра- 
зом, dimM лежит между 0 и 1. Если М — борелевское мно- 
жество положительной лебеговой меры, то 11 (М) >> 0, так что 
dim М =1. С другой стороны, каждое одноточечное множе- 
ство, а следовательно, и каждое счетное множество имеет 
нулевую размерность '). Между этими крайними случаями 
лежит канторово множество, которое, как показал Хаусдорф, 
имеет размерность 1п 2/In3. (Мы докажем это ниже.) Хаус- 
дорфова размерность-измеряет величину множеств на единич- 
ном интервале таким образом, что дает возможность решить 
вопрос о том, какое из двух множеств меры 0 „больше“. 

Пусть М (р) — множество точек на единичном интервале, 
содержащих | в своих диадических разложениях в пропор- 
ции р, т.е. ©=0,@,0,... лежит в М(р) в том и только 

tl 


том случае, когда limn= У, ©, = р. Так как М (1/2) есть мно- 
п k=1 


жество чисел, нормальных по основанию 2, то его лебегова 
мера: равна 1. Если р = 1/2, to М(р) состоит из чисел, не 
являющихся нормальными и, значит, имеет меру 0. Поэтому 
интересно узнать его размерность *). В 1949 г. Эгглстон до- 
казал, что 


dim М (р) = — τῆς [pin p +(1— р) ш (1-2). 


Ὁ Так как интервал есть объединение одноточечных множеств, то 
соотношение (14.3) не имеет места для кесчетных сумм. 

2) В силу (14.3) и того, что множество рациональных чисел имеет. 
размерность 0, вопрос о том, конечно или бесконечно разложение рацио- 
нального @, не влияет на эту размерность, , 
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Этот результат тесно соприкасается с хаусдорфовым резуль- 
татом относительно канторова множества. 
Более общим образом, фиксируем основание г, и пусть. 
х„ (©) есть M-H знак в разложении © по основанию г. Таким 
co 


образом, ® = > x, (®)/!". Пусть число М; (в, п) указывает, 
п=| ᾿ 


сколько раз i встречается среди знаков х, (®),.;., Χρ (®). 
Для вероятностного вектора (Pp, ..., Pr-1) пусть М (po, ..., р) 
‚ обозначает множество тех ®, для которых №; (в, п/п = Dis 


i=0, 1l,..., Г-1. Эгглстон показал, что 
5 1 
dim М (po, «++, Pr-1)= — π-- У р: п р:. (14.4) 
i=0 


Мы дадим доказательство, AEMOHCTDUDYOMes связь размер- 
ности с энтропией. 


Обобщенное определение 


Для истолкования (14.4) дадим сначала другое (эквива- 
лентное) определение хаусдорфовой размерности, а затем 
обобщим его. Для единичного интервала каждый шар есть 
некоторый интервал, а его диаметр — длина этого интервала. 
Поэтому (14.1) сводится к равенству 


1,(M, р) = ἰπὶ Жо: Г, 


где нижняя грань берется по всем покрытиям множества М 
интервалами 9; длины | о, | «о. Далее г-аддический интервал 


o=|4, Ae, ES Ue ое ег 


= 3 
будем называть цилиндром, так как он имеет вид 


а. 
у: ‘ 
при подходящих ἐμ. (Здесь и далее г есть некоторое фикси- 


рованное основание.) Если 
2. (М, р) = inf 21| ο. |", (14.5) 


где нижняя грань берется теперь только по покрытиям MHO- 
жества М цилиндрами длины, меньшей о, то А, (М, 0) отли- 
чается ‘от /,(M, 0), но это отличие не сказывается при 
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вычислении размерностей. Действительно, мы покажем, что 
(М, ©) < (М, о) < 271, (М, 0), (14.6) 
откуда, будет следовать, что если A ae) ies λα(Μ, 0), то 


(М) = © при а< ат М и № (М) =0 при ини так что 
можно определить dim М через A,(M). так же, как и через 
(М). 

Левое из неравенств (14.6) очевидно. Докажем правое 
неравенство для случая г=2 (доказательство в общем слу- 
чае проводится аналогично). Достаточно показать, что ‘если 
и — произвольный интервал, то существуют четыре цилиндра, 
каждый длины, не превосходящей | и |, покрывающие и. Вы- 
берем внутри и цилиндр 9; максимальной длины | 9, | = (1/2)", 
так что и уже не содержит цилиндров длины (1/2)""". Если 
Up И 95— цилиндры длины (1/2)”, лежащие слева и справа 
от 9, соответственно, то один из интервалов VU VY; или у U 95 


является цилиндром длины (1/2)""". Для определенности по- 
ложим, что это интервал %5() vy. Так как он не может ле- 
жать в и, TO Vp заходит за левый конец интервала и. Если 

— цилиндр длины (1/2)”, лежащий справа OT Us, то 95|) 9. 
есть цилиндр длины ays а и, следовательно, он не может 
лежать в и. Таким образом, 9. простирается за правый 
конец интервала ии Uo, ..., 9; покрывают и. При этом 
[|= (1/2)" м. 

Итак, можно определить Чит М как такое число 0, что 
№ (М) = < для а < щи (М) =0 для а> 4. Это новое опре- 
деление полезно для вопросов, связанных с г-адическими 
разложениями, `поскольку в нем фигурируют только покры- 
тия Г-адическими интервалами (или цилиндрами, как мы их 
только что называли)'). 

Придав новую форму определению, обобщим его. Пусть 
Ῥ- вероятностная мера на борелевских множествах единич- 
ного интервала. Положим 


и, (М, ϱ) = Xp (о), (14.7) 


где нижняя грань берется по и-б-покрытиям множества М, 
т. е. по покрытиям цилиндрами у; с мерой и (5;) < о. В даль- 


') Определим размерность исходя из формулы (14.5), только теперь 
нижнюю грань будем брать по о-покрытиям интервалами из заданного 
класса ©. При каких условиях, налагаемых на J, определенная таким 
‘образом размерность совпадает с хаусдорфовой? Мы доказали это совпа- 
дение для случая, когда FY — класс г-адических интервалов, но мне не- 
известны никакие общие условия. Результат такого рода, связанный 
с непрерывными дробями, см. Кинни и Питчер [1]. 


14. СВЯЗЬ С ТЕОРИЕЙ РАЗМЕРНОСТИ 159 


нейшем мы будем для простоты предполагать, что мера μ 
неатомическая; в противном случае и-0-покрытия множе- 
ства М могло бы и не существовать вовсе. Если в — мера 
Лебега, которую мы будем обозначать A, то (14.7) сводится 
к (14.5). При ϱρ-»0 функция u,(M, 0) монотонно стремится 
к пределу и. (М). Как и раньше, можно показать, что и. (М) 
как функция от М есть внешняя мера и что для фиксиро- 
ванного М существует такое 0, что и, (М) = οο при a<a, 
и № (М) =0 при “> 4. Это αρ называют размерностью MHO- 
жества М относительно и и обозначают dim, М. 


Ясно, что Чип, М совпадает с исходной dim М для лю- 
бого М из единичного интервала. Для любого pw имеем 
0 = Ч, М < 1; кроме того, апп, М =0 для счетных М и 
dim,M=1 для борелевских множеств М, для’ которых 
в(М)>0. Соотношения, аналогичные (14.2) и (14.3), также 
` выполняются. 


Основной результат 


Пусть и, (ὦ) — цилиндр длины (1/r)”, содержащий о, т. е. 
тот единственный интервал вида {© : х, (®) =, Е =1,..., п}, 
который содержит ®. Заметим, что ®’ лежит в Un (ὦ) в TOM 
_и только TOM случае, когда разложения @ и @’ по основа- 
нию г совпадают на первых и местах. Пусть и и \— две 
вероятностные меры на интервале. 


Теорема 14.1. Если 
м= о: вы δ}, (14.8) 


/ 


n->oo In и (un (6) ) 


то | 
dim, М = ὃ dim, M -- 14.9) 


бы быть уверенным в том, что отношение логарифмов 
в (14.8) всегда определено, условимся считать, что при 
0<&, y<4 | 


Ind Ίπη - in” oe 

In 0 Int “Ιπ0 oA 

lay idl ine | (14.10) 
InN: 

moe 


Прежде чем доказывать теорему, приведем подтверждаю- 
щее ее эвристическое рассуждение и покажем, как из нее 
следует результат Эгглстона, 
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Представим себе, что для каждого ® из М отношение 


In Vv (un (@) ). 
шы (№ (@) ) 


не только сходится к ὃ, но что оно равно ὃ для всех и. 
‚Если {01} — произвольное покрытие множества М цилиндрами, 
каждый из которых пересекается с М, то любой цилиндр 
‘имеет вид 9; =и,„ (9) при некотором п и некотором ὦ из М 


и, следовательно, ν(οι) = (0:6. Таким образом, Σι v(v;)° = 
eed 
= Συ" для любого покрытия {v,;}. Но тогда v,(M) = 


= i (М), откуда, очевидно, следует (14.9) Это рассуждение 
делает утверждение теоремы правдоподобным. 

Чтобы доказать результат. Эгглетона с помощью тео- 
ремы 14.1, будем считать ий мерой Лебега A. Tak как 


A (u,(®))=2", то из теоремы следует (берем ὃ = 9/1 г), что из 


Mc в: lim [п v(u, ())|= 0} το (MAD 
поро 
вытекает | 
dim M = = Τετ diy M. _ (14.12) 


Если мы построим меру у, ДЛЯ которой выполнено (14, 11) и 
для которой У(М) > 0, то dim, М = 1 и, следовательно, в силу 
(14.12) dim М = 6/Inr. Пусть. у— вероятностная мера на еди- 
ничном интервале, относительно которой {x,} есть последова- 
тельность независимых случайных величин ΟΝ {© : Хи (o)=i}= pi, 
О, 1, sea, п (м. ΠΡΉΜΕΝ 3.5). Tak Kak 


| ау. (@)) = - уме.» Ail, - In pi, 


1-0 
ΤΟ ясно, что (14, 11) BMNOMH RET A если М = Mi pos ass р) 
и 0= — a р: In р:. Так как M (po, ..., Ῥ--ι) имеет у-меру 1 


‚в силу у баленного закона больших чисел, то приходим к ре 
зультату Эгглстона. 


В качестве следующего приложения рассмотрим число 
№; (©, п) тех Rn, для которых Χμ (0) =Ёи Xg4, (0) =7. Если 


Чат Мид (о, п=ль ἡ [-0,...,τ--1, (14.18) 
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TO (π|}) есть (г X /)-матрица с неотрицательными элементами, 
такими, что если р; = р πι)» то oa Nii = pi и =. pial. Пусть 
j 


Pij =i j/Pi, тогда (р) есть стохастическая > MAT HIE: для 
которой р; — стационарные вероятности. Предположим для 
простоты, что p;; положительны. Если у — мера, относительно 
которой (Αι, Χο, ...}— соответствующий марковский προ- 
цесс, то 

lim |-- —Inv (ty (<) ) επί 2 PiPij In Pij 


n> <>. 


‘для любого ® из множества M(x), определенного равен- 
ством (14.13). Так как \(М (п)) =1, το, как и раньше, полу- 
чаем 


Е 1 
dim М (x) = — — У PiPi; Ш р; ;. 
ij 


Из сравнения этих результатов с теоремой Шеннона — 
Макмиллана — Бреймана видна их связь с энтропией. 

Для третьего приложения теоремы 14.1 предположим, что. 
г=зЗи po= ро = 1/2, р! =0. Пусть у — мера, относительно кото- 
рой {x1, Хо,....} = независимые случайные величины U V{x,=i} =p; 
(у— канторова мера из $ 3). Величина — и ' Шу(и„ (®)) равна 
119, если все х,„ (0) равны либо 0, либо 2, т. е. если ὦ лежит 
в канторовом множестве. Таким ‘образом, 


Mcf{a: lim | - a Inv(u,(0))|=In2}, 


n-> © 


если М — канторово множество, так что в силу того, что из 
(14.11) следует (14.12), 


dim М = те 


Так как v(M)=1, To мы оу результат Хаусдорфа: 
dim М = In 2/13. 

Перейдем к доказательству теоремы 14.1. Достаточно. 
показать, что из (14.8) вытекает неравенство. 


dim, ΔΙ: ὃ ани, М, — | (14.14) 


так как обратное неравенство получится, если поменять μ 
и V местами, а ὃ заменить на 1/6. Докажем несколько больше, 
а именно что неравенство (14.14) выполняется, если 


In v (ии (@) ) ) | 
мс |: im ra (tw) >] (14,15) 


h-> 


1] Зак, 1491 
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Сначала докажем этот результат в предположении, что 
и (9) >0 для любого цилиндра v, пересекающего М; позднее 
мы укажем на изменения, необходимые для исследования 
общего случая. 

Достаточно показать, что если 16<пи dim, М < &, то 


| dim УМ S18. 
Если @&M, то в силу (14.15) v (up, (©) )" πα τοὶ для 
всех п, больших некоторого натурального М (®). Пусть М, 


множество тех ®, которые лежат в М и при каждом п удо- 
влетворяют одному из двух неравенств: 


и (и„ (©)) 0 или у(и, (9) )" < (и, (©)). (14.16) 
_Ясно, что M, возрастает с убыванием 0, мы покажем, 


что М 1 М прир {| 0. Если @&M, возьмем о=ь (их ω) (@)) > 0 


(здесь нам нужно предположение, что цилиндры, пересекаю- 
щие М, имеют положительную п-меру). Если и (и, (®)) о, 


то п>М (®), так что у(и„ (в) )" < и (и, (®)). Таким образом, 
ὦ удовлетворяет (14.16) для всех и, т. е. OE My. 


Так как М, 1 М, то в силу (14.3) достаточно доказать, что 
dim, Mp < "Е (14.17) 


для всех положительных о. Предположим, что O<9,<p u 
= >0. Так как dim, М, <, то 


ΣΙ μ(υ;)᾽ = 21 


для некоторого и-р!-покрытия {v,;} множества ΛΜ». Можно 
предположить, что все v; пересекают M,. Но тогда "0; = =u, (0) 


для некоторого @@ M,, так что в силу ий (°;) < 0, «р имеем 
у (и;)" < в (°,). Поэтому 


> ν (υὐ) 5 < Ει. 


Но {v,} есть \-о-покрытие множества M,, и, следова- 
тельно, так как в и 0; произвольно малы, TO Ven (Мь) = 0, 
что доказывает (14.17). 

Остается снять ограничение и (9) >> 0 для всех цилиндров 9, | 
пересекающихся с М. Пусть Е, — объединение всех цилин- 
дров и-меры 0. Так как dim, Е, = 0, то dim, А = dim, В, если 
симметрическая разность множеств А и В входит в Е, (uc- 
по 'ьзуем (14.3)). Если ὦ лежит в множестве, фигурирующем 
в правой части соотношения (14.15) (при 6>0), и если 


14. СВЯЗЬ С ТЕОРИЕЙ РАЗМЕРНОСТИ [τ 


u({u,({o))=90 для некоторого п, то V(u,,(@))=0 для некото- 
рого т в силу соглашения (14.10). Таким образом, МПЕ, = 
_ С МПЕ.,. Мы уже знаем, что (14.14) справедливо для M— Es 
следовательно, 


dim, М = dim, (М — Εμ) >6 dim, (М — Εμ) > 
= ὃ dim,(M —Е.) -- ὃ dim, ΛΙ. 


Замечание. Относительно связи хаусдорфовой размер- 
ности с топологической размерностью см. Гуревич и Вол- 
мэн [1]. 

Гуд [1] выдвинул предположение о том, что имеет место 
(14.4). Доказано это соотношение было Эгглетоном [1]. Бил- 
лингслей [1, 2] получил дальнейшие результаты методами 
этого раздела, а Кинни и Питчер [1] применили эти методы 
к проблемам размерности, связанным с разложениями в не- 
прерывные дроби. О связи с теоремой кодирования для 
канала без шума см. Биллингслей [3]. Реньи [2] исследовал 
связь между размерностью и энтропией '). 


1) В работе Фюрстенберга [1] изучена связь хаусдорфовой размер- 
ности с так называемой топологической энтропией (см. Адлер и др. [1]). 
Соответствующие результаты близки к содержанию этого параграфа. — 
^ Прим. ред. 


11’ 


«- 
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Обозначения 


В этой главе мы будем рассматривать одновременно не- 
сколько сдвигов И поэтому следует сразу договориться 
об обозначениях. Кроме конечного множества о (пространства 
состояний), понадобятся еще два ‘множества, которые мы 
обозначим о и τ. Конечное множество о [0, τ] состоит из г 
[s, | элементов, причем общий элемент будем обозначать J 
[1, κ]. Мы называем эти множества алфавитами, а их эле- 
менты — буквами. 

Обозначим через Х [Y, 2] пространство бесконечных в обе 
стороны последовательностей х=(..., ха, Χῃ, Χι,...) [У = 
нь ПЕ... элементов 
из 9 [o, τ], а через .% [Y, %] обозначим о-поле, порожденное 
цилиндрами. Позволим себе некоторую вольность в обозна- 
чениях, а именно будем использовать символ X, в двух 
смыслах — для обозначения N-H координаты (при фиксиро- 
ванном х) и для обозначения координатной переменной (при 
фиксированном п). Кроме того, мы будем рассматривать 
пространства, подобные ХХ У, и тогда x, будет обозначать 
функцию, значение которой в точке (x, и) есть п-я коорди- 
ната для XxX. Эти соглашения относятся также к и, и 2p. 
Сдвиги будем обозначать Ty, Тхху и т. д. или, если нет 
опасности ‘путаницы, просто Г. 

Символ 0” [o”, τ΄] обозначает множество наборов по 
п элементов из о [o, τ]. Если и — некоторая вероятностная 
мера на .@, которая сохраняется преобразованием Ty, 000- 
значим всю структуру (Х, &, в, Ty) просто [Х, μ]. Единст- 
венный меняющийся элемент здесь и; говорят, что мера μ 
(или [Х, ц]) эргодическая [перемешивающая и т. д.], если 
сдвиг Тх эргодический [перемешивающий и т. д.]|] OTHOCH- 


тельно р. Энтропия меры [X, μ] есть энтропия сдвига Ty. 


Подобные замечания относятся и к пространствам У, 7. 
Будем называть [X, μ] источником, или источником инфор- 
мации (см. $5). Мы рассматриваем x, как буквы, созда- 
ваемые источником, а последовательности (Xp, ...» Хи) Ἡ 
х=(..., х_ь Χρ, Хь ...) как сообщения. Мера wp описывает 
структуру этого источника. 
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Канал без шума | 


Теорему кодирования для канала без шума можно фор- 
мулировать в терминах кодируемых сообщений как утвер- 
ждение о том, как сделать эти сообщения наиболее корот- 
кими или как использовать наименьший алфавит. Мы pac- - 
смотрим теорему кодирования с:этой последней точки зрения, 


Алфавит б Алфавит б 
Передатчик os Приемник 
Пространство У Пространство у 
Рис. 5. 


и это послужит введением к более сложным проблемам 
последующих параграфов. 

Канал без шума состоит из передатчика и приемника, 
каждый из которых использует алфавит o (рис. 5). Матема- 
тически канал без шума есть просто конечный алфавит σ 
объема $ и соответствующее пространство последователь- 
ностей (У, 2). (Мера здесь не участвует.) Если сообщение у 


Алфавит р Алфавит в Алфавит б Алфавит Г. 


Kodu- Rigas Aexodu- , 
рующее а Приемник рующее | 
устройство устройство 
Пространство Х Пространство У Пространство У Пространство Х 
канал 
Рис. 6. 


посылают по каналу, то на другом конце канала его полу: 
чают без всяких искажений. 

Предположим теперь, что сообщения должны быть по- 
сланы источником по каналу некоторому адресату, причем 
источник и адресат пользуются алфавитом о, а канал — ал- 
фавитом о. Если р и о различны, то, очевидно, сообщение 
должно быть кодировано ') некоторым образом до передачи 
и декодировано впоследствии (рис. 6). 

Если источник создает, скажем, одну букву в секунду, 
то мы требуем, чтобы по каналу передавалась тоже одна 
буква в секунду— ни быстрее, ни медленнее. 


') Слово „код“ здесь не имеет ничего общего с секретным сообщением. 
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Предположим, что объем г алфавита ϱ не превышает 
объема s алфавита о (г< $). Например, о может состоять 
из г = 10.знаков 0, 1, ..., 9, або — из $ = 26 букв А, Β,..., Ζ. 
Ясно, что сообщения, создаваемые источником, можно коди- 
ровать таким образом, чтобы они могли быть переданы 
по каналу (отложим на время точное математическое опре- 
деление понятия кода). Действительно, возьмем некоторое 
взаимно однозначное отображение ip алфавита о в алфавит σ; 
оно существует, если г < $. Кодируем последовательность x, 
заменяя каждый символ X, символом Y,=(x,), и пошлем 
сообщение, состоящее из этих элементов алфавита ©, по ка- 
налу. Для того чтобы восстановить посланное сообщение 
на другом конце канала, к полученным буквам можно при- 


менить обратное отображение |. 

Последовательность х может быть передана по каналу, 
даже если г>$. Это ясно, когда, например, существует 
такое подмножество 05 множества о, объема не больше $, 
что μ {χ᾽ Е 0} =1. Рассмотрим менее тривиальный пример: 
пусть r=4, s=2, и пусть структура меры и такова, что Ka- 
ждая буква с вероятностью | повторяется, т.е. и {хи = хои+ = 1. 
(Этот источник не вполне стационарен, но пример можно 
изменить так, чтобы он был вполне стационарным; см. при- 
мер 3.3.) В 0? имеются только четыре возможных значения 
(Хоп, Хоп-1). Пусть ф — взаимно однозначное отображение этих 
элементов на четыре элемента из о”. Если сообщение коди- 
ровано с помощью 1: (Yon Yon+1) = $ (Xan, Xonst)s то X, можно 
однозначно восстановить по ии, и, следовательно, код делает 
возможной передачу х по каналу. 

Итак, задача состоит в том, чтобы кодировать х ву 
предпочтительно таким образом, чтобы затем х можно было 
восстановить по у. Мы должны теперь точно определить, 
что мы понимаем под кодом. Код есть измеримое отобра- 
жение ф пространства Х в пространство У. Можно потре- 
бовать, чтобы код обладал некоторыми нужными свойствами. 

|. Стационарные коды. Код ф стационарен, если равенство 


“QT yx = Туфх (15.1) 


справедливо для всех х из Х. Это означает, что структура 
кодирующего устройства не меняется со временем. Мы всегда 
будем требовать, чтобы код был стационарным; с этого 
момента стационарность является частью определения кода. . 
2. Обратимые коды. Код ф обратим, если он по существу 
взаимно однозначен, т. е, в .* существует такое множество Χρ, 
что μ(χο)--1 и ф- взаимно однозначное отображение -- 
жества X, на У, =ФХ.. Мы требуем также, чтобы ΤχΧο-- 
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и gAG@Y для любого множества A, для которого AC Χα 
и Де. (Так что, в частности, У, = “/). Код ф называют 
обратимым, когда такое множество Ху существует. Если код 
обратим, то посланное сообщение (по существу) однозначно 
восстанавливается по полученному. 

В то время как понятие кода определяется безотноси- 
тельно к какой бы то ни было мере μ на X, обратимость 
конкретного кода зависит от того, какую меру в мы рас- 
сматриваем. Для того чтобы подчеркнуть роль меры μ, 
говорят, что код ф обратим по отношению к и. | 

Предположим, что код ф обратим по отношению к μ. 
Покажем, что сдвиг Гх с мерой p и сдвиг Ту с мерой ug? 
изоморфны. (Значение pg! на BEY есть в (ф'В); напомним, 
что ф всегда предполагается измеримым. Мера ug! является 
распределением полученных сообщений.) Очевидно, что У Е, 
μφ-! (У) =Ти ТуУ,= У,. Пусть Фи — сужение ф Ha Χρ. Пред- 
положим, что AC Χρ, и положим В =фуД. Тогда если Αεεώ, 
то BeY в силу определения обратимости кода ; если 
Bey, το А=Х,Пф'В =. 17 в силу измеримости ф, и если 
AE Y, то, разумеется, п (А) = иф`' (В). Так как фоГхх = Туфох 
для всех х из Ху, то тройка (Χρ, Yo, Фо) удовлетворяет усло- 
виям (1), (19) и (15) изоморфизма (см. § 

Пусть, с другой стороны, сдвиг Ty с мерой p на Х изо- 
морфен сдвигу Гу с мерой y на Y. Так как Tx и Ty обра- 
тимы, TO из замечания 5, следующего за определением изо- 
морфизма в $ 5, вытекает, что они изоморфны относительно 
тройки (Χο, Yo, Po), обладающей тем специальным свойством, 
что Τχλρ-- Χο ἡ ТуГу= У. В этом случае фу почти является 
обратимым кодом (HO не вполне), так как отображает Ху 
на Yo, ane ХвУ. Расширим @ до отображения ф с областью 
определения Х, полагая фх = Фх для x из Хуи взяв в каче- 
стве фх для x из X— Ху некоторый элемент (..., |, |, j,..-) 
пространства У, все компоненты которого одинаковы (общий 
образ для всех x из X— Χο). Тогда ф обратим по отношению 
к в, его сужение на Χρ есть снова фу и мера pq! идентична 
_ мере у. 

Таким образом, обратимый код по существу является 
изоморфизмом. Поэтому теория кодирования связана с тео- 
‚рией, развитой в гл. 2. 

3. Коды без предвосхищения. Код ф называется кодом 
без предвосхищения, если для всех | из о и всех целых Nn 
множество @! {y: у, = j} = {x : (px), = j} принадлежит о-полю, 
порожденному случайными величинами ..., Χῃ-]ν X,. (Обра- 
щаясь к мере UW на Х, можно более общим образом потре- 
бовать только, чтобы ф' {и : у, = j} отличалось на множество 
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меры 0 от некоторого элемента этого о-поля. Но мы не 
нуждаемся в таком расширенном определении.) 

4. Коды с обращениями без предвосхищения. Если код @ 
обратим, то сужение фо кода φ, которое отображает Χρ Ha Vo, 
имеет обращение фу', отображающее У, на Ху. Такое обра- 


щение Фо! можно расширить одним или несколькими спо- 


собами до некоторого обратимого кода, отображающего У 
в Х. Можно также требовать от одного из этих расширений, 
отличающихся друг от друга лишь несущественно, чтобы 
оно являлось кодом без предвосхищения. В этом случае 
декодирующее устройство может не отставать от кодирующего, 

_Ббльшая часть этих условий ‘накладывается на понятие 
кода, что затрудняет доказательство существования кодов. 
с заданными свойствами и облегчает доказательство их не- 
существования. 


Теоремы кодирования 


В случае канала без шума проблема состоит в следую- 
щем. Для заданного источника [X, μ] с алфавитом о и канала 
без шума с алфавитом O ищут код ф (из Х в У), обратимый 
по отношению к μ. Если такой код ф существует — и это 
является доматематической идеей, лежащей в основе про- 
блемы, — то сообщение х может быть кодировано в виде фх 
и послано по каналу к приемнику, где посланное сообщение 
может быть восстановлено из фх. Кажется интуитивно ясным, 
что для каждого из двух примеров, предшествовавших опре- 
делению кода, обратимый код существует. В первом из этих 
примеров множество р мало (или по крайней мере буквы, 
создаваемые источником, принадлежат маленькому подмно- 
жеству ру множества р), а во втором примере источник по- 
вторяет каждую букву дважды. Каждая из этих двух харак- 
теристик ограничивает скорость, с которой источник создает 
информацию. Дело в том, что обратимый код существует 
в том и только том случае, если энтропия источника [X, μ] 
не превышает Ins. 


Теорема 15.1. Если энтропия h источника [Х, μὶ пре- 
вышает Ins, то не существует кода (из Х в У), обратимого 
по отношению кц. 


Доказательство. Если обратимый код ф существует, 
то сдвиг Гх (с мерой и) изоморфен сдвигу Ту (с мерой pq). 
Но тогда Ту также имеет энтропию A. Так как алфавит σ 
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содержит $ букв, то (см. (7. 1)) h=h(Ty) <Ins, что доказы- 
вает теорему. 

Основной момент этого доказательства заключается в TOM, 
что из изоморфности Тх и Ту мы делаем вывод, что Й(Ту)= 
= (Ту); это указывает на важность инвариантного опреде- 
ления энтропии. С другой стороны, естественная мера ско- 
рости, с которой источник [X, и] создает информацию, есть 


| Λ : 
lim = he η(μ {10 = lo, ба Whol in-1) 


n->oo ПМ 
ой 


fi-1 

(т. е. h(A, Ty), где £—none событий, наблюдаемых в MO- 
мент времени 0), и если A(Tx) не совпадает с этой величи- 
ной, то A(Ty) не является естественной мерой скорости со- 
здания информации; это указывает на важность теоремы 
Колмогорова. Таким образом, доказательство фактически 


использует все содержание гл. 2. 


По поводу обращения теоремы 15.1 мы докажем только 
один условный результат. 


Гипотеза. Источник [Х, wl имеет энтропию h, и 
сдвиг Tx с мерой μ. изоморфен любому сдвигу Бернулли 
с энтропией И. 

Если энтропия — полный инвариант (см. $ 8) для сдвигов 
Бернулли (соответственно перемешивающих сдвигов Мар- 
кова, сдвигов Колмогорова и т. д.), то это предположение 
выполнено в случае, когда источник [Х, μ] является бернул- 
лиевским (соответственно перемешивающим марковским, 
колмогоровским и т. д.). Возможно, что это ‘предположение 
не выполняется вообще ни для какого источника. 


„Георема“ 15.2. Если й < Ш $, то при справедливости 
высказанного предположения существует код = Х.@ У 
обратимый по отношению к WU. 


Доказательство. Функция Σιη(ρ) вектора вероят- 
j 


ностей (Ρι, ..., Ps) принимает все значения между ее мини- 
мумом 0 и максимумом ш$ (например, если Ё изменяется 


от 0 до 1, το δ)η(ξογ! 1-(1--) 6) непрерывно меняется от 0 

до Ins). Поэтому если А < ш5, то существуют такие вероят- 

ности р1,..., р» что Жт(р) =. Если y— мера на У, кото- 
; | 


рая делает сдвиг Гу сдвигом Бернулли (ри, ..., Ps), TO Ту 
имеет энтропию ft. По нашему предположению сдвиг Ty 
с мерой w изоморфен сдвигу Ту с мерой у; следовательно, 
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существует код @, обратимый по отношению к и (и, между. 
прочим, обладающий свойством pq! = γ). 


Этот результат справедлив, но, быть может, бессодержа- 
телен; отсюда кавычки. Вопрос, является ли этот результат 
бессодержательным, эквивалентен вопросу о том, является ли 
энтропия полным инвариантом. Если эта „теорема“ ослож- 
няется предположением, что наш код — код без предвосхи- 
щения, то это означает на самом деле, что вопросы, поста- 
вленные в $ 8, осложняются требованием зависимости изо- 
морфизма только от прошлого — сравните с результатом 
Синая о слабом изоморфизме. 


Замечание. Начало изучению этих проблем кодиро- 
вания положил Шеннон [1]. Теорема 15.1 предложена мною — 
по крайней мере я не встречал ее в литературе. Это, ко- 
нечно, весьма простое следствие теории Колмогорова. 
Не встречал я и „теорему“ 15.2. Теорему кодирования 
для каналов без шума, изложенную с других точек зрения, 
можно найти у Файнстейна [2], Хинчина [3] и Биллингслея [3]. 
В этих работах имеются варианты теоремы 15.1, по-разному 
неудовлетворительные, но в них содержатся конструктивные 
варианты „теоремы“ 15.2. 
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Определения 


Рассмотрим теперь канал, в котором на передаваемые 
сообщения действует шум, т. е. канал, в котором получен- 
ное сообщение может не быть точной копией переданного. 
Здесь передатчик и приемник могут использовать различные 
алфавиты (рис. 7). 

Для математической формализации этой схемы рассмо- 
трим пространства (У, 9) и (7, ®,). Предположим, что для 
каждого уе У имеется некоторая вероятностная мера V,(-) 
на &. Будем считать, по техническим соображениям, что 
для каждого множества С из ὦ мера v,(C) как функция 


от у измерима относительно Y. Тройка [У, v,, 2] называется 
каналом; функция v,(-) называется ядром канала. Идея 


состоит в том, что если сообщение у передается по каналу, 
то полученное сообщение, которое будет, вообще говоря, 
искажено каким-либо случайным шумом, находится с ве- 
роятностью v,(C) в подмножестве С множества Z. В случае 


канала с шумом проблема состоит в кодировании данного 
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источника [X, ц| в У так, чтобы канал использовался наи- 
более эффективно. Например, можно задаться вопросом, 
выгодно ли бороться с шумом, повторяя каждую букву 
дважды. (Структуру канала и источника мы предполагаем 
полностью известной и не а бы проблему стати- 
стического вывода.) 


Алфавит 6 Алфавит <” 


Передатчик ~ Приемник 


Пространство У Пространство 2 


Puc. 7. 


Хотя мы можем здесь без потери общности использовать 
один и тот же алфавит для источника, передатчика и прием- 
ника, мы все же, для упорядочения обозначений, возьмем 
алфавиты о, O и т соответственно. 

Econ У=ё и vy представляет собой единичную массу, > 


сосредоточенную в у, то мы имеем канал без шума, описан- 
ный в предыдущем параграфе. Если *,— единичная масса 


для каждого у (Z может отличаться от У), ‚то мы ‘имеем 
некоторый код из У в Z. 
Канал стационарен, если 


(Т„С)=м, (С). 


Это, как обычно, означает, что свойства канала не меняются 
со временем. Мы всегда будем предполагать канал стацио- 
нарным и включим это требование в определение. 
Канал называется каналом. без предвосхищения, если 
для каждого п и каждого Е ет функция %,{2:2„ =} из- 


мерима относительно 0-поля, порожденного элементами 
..., Иль Yn» (Код есть специальный род канала. Понятие 
канала без предвосхищения соответствует понятию кода 
без предвосхищения..) 
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Канал без памяти 


Рассмотрим такой специальный вид канала: пусть (су) 


есть ($ Х В-матрица неотрицательных чисел, строки и столбцы 
которой нумеруются элементами алфавитов о и т соответ- 
ственно и суммы по строкам равны 1. Ядро %,(.) задается 
формулой 


vy {= m<l<n} cael Cy Rp. 


Этот канал передает буквы входного сообщения независимо; 
если по каналу передается буква |, то буква Rk получается 
на выходе с вероятностью с}. (Разумеется, сами буквы 


на входе не предполагаются независимыми; в самом деле, 
меры на пространстве У не участвуют в описании структуры‘ 
канала.) Канал такого рода — очевидно, что он стационар- 
ный и без предвосхищения — называют каналом без памяти '). 
Заметим, что если о=тис,,=| для всех j, то мы имеем 


канал без шума, описанный в предыдущем параграфе. 

Доказывая, что хорошие (в смысле выполнения некоторых 
свойств) коды не существуют, мы не будем накладывать 
на каналы никаких ограничений. Доказывая, что хорошие 
коды существуют, мы основное внимание уделим каналу 
без памяти. 


Совместное распределение на входе и выходе 


Предположим, что задана мера μ на У такая, что 
[У, μ] есть источник. Мы хотим определить на произведении 
пространств (УХ Ζ, ¥X FJ) некоторую вероятностную меру Р, 
которая будет описывать совместное распределение на входе 
и выходе канала. Очевидно, нам нужно, чтобы для BEY 
и ΟΕ: 2 выполнялось равенство 


P(BXC)= | v,(C)p(dy). (16.1) 
B 

Этот интеграл определен в силу предположения, что у, (С) 
как функция от у измерима. Положим для множества М 

из κ > 

Р(М)= | v, {2:(y, 2) Е M}u (dy), 
у 

1) Более общее понятие канала с конечной памятью см.. например, 


у Хинчина [3]. (См. также Такано [1], который исправил ошибку в рас- 
суждении Хинчина.) | 
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при M=BxXC это сводится к (16.1). Класс множеств М 
из YX ZS, для которых подинтегральное выражение есть 
функция, измеримая относительно Y, содержит конечные 
объединения непересекающихся прямоугольников BXC и 
в силу монотонности совпадает с YX J. Итак, интеграл 
определен. Теперь легко проверить, что Р есть вероятност- 
ная мера и что это единственная мера, удовлетворяю- 
щая (16.1). 

Если источник и канал стационарны, а мы всегда пред- 
полагаем, что это так, то можно ожидать, что сдвиг Ty xz 
сохраняет меру Р. 


Теорема 16.1. Мера Р сохраняется при сдвиге Ty xz"). 


Доказательство. Достаточно показать, что Т = Тухл 
сохраняет меры прямоугольников BX С. В силу (16.1) имеем 


P(T (BX C))= | vy (77'C) μάν) = 


ra 
Ту В 


= [νει (2) uldy) = | ¥,(C)u(dy)=P(B XC). 


B 


Распределение, индуцированное мерой Р на У, совпадает 
с в. Распределение, индуцированное на Z, есть распределе- 
ние на выходе ‘канала; как следует из теоремы 16.1, оно 
сохраняется при сдвиге ТУ). 


Скорость передачи. 


Определим теперь скорость передачи по каналу [Y, v,, 2] 


для источника [У, ц|. Каждому из трех сдвигов Тухл 
(с мерой P), Ty [с мерой p(B)=P(BX Z)] и Tz [с мерой 
Р (УХ С)]|] приписывается некоторая энтропия. Скорость 
определяется формулой 


R=A(Ty) + В(Т2)— В(Тьх 2). 


Интуитивный смысл этой формулы мы обсудим несколько 
позже. Cad 

Более детально скорость можно изучить с помощью 
теоремы Колмогорова. Пусть ge (соответственно 8) обо- 
значает конечное поле в YX Х с атомами {(y, 2): и=Д, 
j =o (соответственно {(y, 2) : 2. =k}, Ее). Обозначим через 
@\/@ поле событий из YX Z, наблюдаемых в момент 


1) ly xz действует ΠΟ формуле фм (и, 2) 54 (Τγυ, T 72). ree Прим. ред. 
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- 


времени 0. Нетрудно показать, что если ®, — конечное поле 
-. им —1 
в 2/ с атомами {у : Y) = j}, | So, то ην я η(ν г. 
- 1=0 ! 
где T=Ty xz. Поэтому в силу теоремы Колмогорова А (Ту) = 


= (Ту, ®,) = (Т, 4). Применяя аналогичное рассуждение 
к сдвигу 77, видим, что если ввести обозначения 


п-! 
н(\ г*#)- ПР ee ay Va 
Π--ἱ : 
н( № г) Н (2, e089 ae? 
k=0 


a(Vre (BV é) =Н (Yo) +++) Yn-t» 20» ++ +9 ἄπ-ι), 
TO : | 
R= ть ..., И ОТ о ан 
Hy бра BD (16.2) 


e / ; 
Используя свойство (А!) из $ 6, можно переписать выра- 
жение, стоящее в фигурных скобках ‘B (16.2), двумя спо- 
собами. Имеем: 


(Yo, very Yn-1) + Н (2%, ee Zn-1)— H (Yo; ..., Yn-1> Zo» ones 22-1) = 
= H (Yo, «++» Yn-1) — Н (Yo; . ony ed ое 21-1) = 
=Н (Zo, νας, τ goes, se! (2%, see, ἕπ-ι | Ус» 5-8. 64 ἥπ-1)- (16.3) 


Средний член формулы (16. 3) имеет следующую интер- 
претацию. Если бы мы получили сообщение Yo, ..., Ишь 
то (среднее) количество полученной информации равнялось бы 
Н (Yo, «++, И, ) — прирост информации равен устраненной 
неопределенности. Однако если сообщение Yo, ..., Yn-1 было 
передано по каналу таким образом, что мы получили вместо 
него искаженное сообщение 2%, ..., 2..1, ТО к той неопреде- 
ленности, которой обладало посланное сообщение Yo, ..., Yn-ts 
прибавляется еще некоторая неопределенность — (среднее) ко- 
личество этой неопределенности есть Н (Yo, ..., {3-1 |209»... 2—1). 
Поэтому разность между этими двумя величинами, т. е. 
средний член формулы (16.3), является разумной мерой 
(среднего) количества получаемой информации. Итак, 


полученная информация = 
= информация в посланном сообщении 
минус неопределенность от искажения при передаче. 
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‚Таким образом, 


R= lim ТН (Yo vee led We 53° Yn-1lZor ++ +1 21-1} 


п> oo 


представляет собой количество полученной информации, 
приходящейся на букву, и, следовательно, задает скорость. 
Величина. 


lim — = H (oy «+> Yaa |2or --.. Ena) = A (Ty) — R=h(Tyxz)—hA(Tz) 


n->oo It 


называется ненадежностью (Ha букву). Если энтропия источ- 
ника фиксирована, то увеличение скорости передачи равно- 
сильно уменьшению ненадежности. 

Если мы принимаем ту интерпретацию энтропии и услов- 
ной энтропии, которая была предложена в гл. 2, то эти 
определения естественны: высокая скорость (малая ненадеж- 
ность) хороша, а низкая скорость (большая ненадежность) 
плоха. Другой подход к измерению эффективности пары 
источник — канал состоит в рассмотрении проблемы реаль- 
ного построения эффективного алгоритма для восстановления 
посланного сообщения по полученному. Хотя этот второй 
подход косвенным образом опирается на материал δ 18 и 19, 
мы He будем изучать его систематически \). 

Явно вычислить скорость мы можем только в специаль- 
ных случаях. Пусть (c;,) есть (s Х )-матрица, описывающая 


‘канал без памяти. Так как 

Н (2, -..› Sy] | Yo; =. - Yn-1) age 

ee | | pe (Cust, и 1) In (Cugky ve. Con shn-1) fi (dy), 
Sp η 


TO 

Н (2, sees Sy] | Yos cee Yn-1) =nH (2p | Yo) (16.4) 
независимо OT распределения величины .y,. Для любого 
множества вероятностей-р!,..., р; на алфавите о определим 


другое множество вероятностей Gi, +++, 9: на алфавите τ 
по формуле 


де = Σ DP jC jr. 


1) Сравнение этих двух подходов обсуждается у Файнстейна [2, гл. 3]. 
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Π ПОЛОЖИМ 


ры: p= Утер- Ув Ул (Pu) = 
= Sng) — Ур, Ynley) = 
} j р 


= тр + Lint (qx) — лох je) (16.5) 


Если | fee | ` 
и LEE OY oe: (16.6) 
то, даже если и, не независимы относительно μ, 
г (ра, ..., р) =Н (Yo) — A (20) = 
= Н (20) — H (214) = | 
= H (yo) + H (20) — H (Yos 20). (16.7) 


ee выполняется (16.6) и если и, независимы, то 

‚ Н (о ἕν Reg Hens Ramer (Yo: st ss Uaels eos kaa 2-1) = 
= nH (y.) + nH (2) — nH (Yo, 2) = nr (би Pals 

так что скорость задается формулой 


Ю=г(ри, ..., Ds) (16.8) 


Это соотношение может не выполняться, если {/ He неза- 
ВИСИМЫ. | 


Пример 16.1. Пусть имеется канал без памяти, где 
$=2, [=3, и матрица (с;„) есть 


πη 
О. 
Ὁ ερ Ss 


Для любых во: на входе (pj, Ρο) матрица (рус γε Ч») 


есть 
bp 0 
ГЕ 
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так что Н (и |2.) =0. Даже если y, не независимы, то в силу 
свойств (А.) и (A;) из $ 6 


ее 


Η (yp; ...у Yn-1 |2o +29 Zn- > DAW lz αὐ ae 2) Ss 


< SH A (y;|2;) =9 


=0 
= 


так что ненадежность исчезает. Для этого канала скорость 
всегда совпадает с энтропией на входе '). 


Пример 16.2. Пусть имеется канал без памяти, где все 
строки матрицы (с) одинаковы: Cj, не зависят от ]. Тогда 


Н (2, |) = Н (20) и, следовательно, в силу (16.4) 


Η (Zp) «035 Sn) = Но; ...ν 2 М ++ +> Yn-t) = 
é = Zi, ek; риа 


В силу свойства (A,) из`$ 6 эта величина равна нулю. Ско- 
рость всегда нуль, независимо от входа; по этому каналу 
не может быть передано никакой информации °). 

Пример, описывающий промежуточную ситуацию между 
двумя крайними, представленными примерами 16.1 и 16.2, 
показывает, что скорость обычно зависит не только от источ- 
ника и не только от канала, а от их взаимодействия. 
| Пример 16.3. Пусть имеется канал без памяти, где 
gs=t=4, и матрица (с;») есть 


Ὁ 05 
ое <0 
За, 
т 
anaes | 
[Sev SS 


Из (16.5) следует 


(Pi +++, Ра) =п (р) + т (рэ) + п (рз + ps). = (6.5, 


Предположим теперь, что Y, независимы относительно μ, 
так что (16.9) задает скорость передачи, а 


9 (р!) + т (po) + (ps) + ч (ра) 3, (A6.10) 


1) Канал, подобный этому, называется каналом без потерь. См. 
Файнстейн [2]. ; | 

2) Характеристика каналов без памяти, обладающих этим свойством, 
дана у Файнстейна [2]. 


12 Зак. 1491 
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_— энтропия источника [У, в]. Если р, =р. =0, то скорость 

(16.9) равна нулю, в то время как энтропия (16.10) может 
достигать 2; такой источник плохо согласуется с каналом. 
С другой стороны, если р.=0, то скорость (16.9) и энтро- 
mua (16.10) совпадают, хотя их общее значение может рав-_ 
няться нулю; такой источник хорошо согласуется с каналом. 


Пропускная способность канала 


Скорость передачи зависит и от источника [Y, μ], и от 
канала [Y, vy, Z]; для фиксированного канала [У, v,, Z] ско- 
рость есть функция А, меры и, описывающей вероятностную 
структуру источника. Верхнюю грань этих скоростей 


C=sup R, (16.11) 


называют иропускной способностью. 

Пропускная способность — это скорость, с которой инфор- 
мация может быть передана по каналу, если он используетея 
‘наиболее эффективным образом — путем выбора источника, 
„подходящего“ этому каналу. (В действительности мы обычно 
не знаем, достигается ли эта верхняя грань.) По техническим 
соображениям мы должны различать две пропускные спо- 
собности. Если верхняя грань в (16.11) берется по всем 
мерам и, которые сохраняются сдвигом Ту, то мы имеем 
стационарную пропускную способность С.. Если верхняя 
грань берется только по тем и, относительно которых сдвиг Ту 
эргодичен, то мы имеем эргодическую προπμοῆθιο способ- 
ность С,. Очевидно, что С, <С.. 

Заметим, что для канала без шума, описанного в преды- 
дущем параграфе, C,=C,=Ins. Вообще вычислять про- 
пускную способность довольно трудно, но для канала без 
памяти это сделать можно. 


Теорема 16.2. Для канала без памяти 


ча ЕЙ 


где (py, ...» Ps) пробегают все возможные распределения 
вероятностей на алфавите о. 


Доказательство. Выбирая ру, ..., Ps так, чтобы макси- 
мизировать г(р,,..., р.) (используя компактность), и вспо- 
миная, что сдвиг Бернулли эргодичен, в силу (16.8) полу- 
чаем С, > махг(р:, ..., Ρο). 
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Для доказательства неравенства C,<maxr(p;,..., р.) 
достаточно показать, что для любой меры и на входе и для 
любого ий справедливо неравенство 


я sc eg PA fore 2 fe 7 eee, ὅῃ-ι | Yo. ...›» Ин = 
< nH (2) —nH (2 Yo): 
Очевидно, что 


аа. Hl ene SH), 
и наше утверждение следует из (16.4). 


Это рассуждение показывает, что для канала без па- 
мяти верхняя грань в определениях С; и С, достигается; 
для более сложных каналов это доказать трудно. | 

В примере 16.1 пропускная способность канала равна 
Ins=In2; в примере 16.2 она равна 0, а в примере 16.3 
она равна ш3.. 


Эргодичность процесса передачи 


_ Можно задаться вопросом, какие условия на канал [У, v,, Z| 


обеспечивают: эргодичность входной — выходной меры Р [οπ- 
ределенной соотношением (16.1)], какова бы ни была мера μ. 
Необходимые и достаточные условия неизвестны. Сформу- 
лируем и докажем следующий результат, который в даль- 
нейшем использоваться не будет. 


Теорема 16.3. Канал без памяти обладает тем свой- 
ством, что мера Р эргодична, какова бы ни была мера μ 


Доказательство. Достаточно показать (теорема 1.4), что 


oes 
lim — \ P(EN TE’) =P (E) P(E) (16.12) 
п> о It Fae 

для цилиндров Ε и Е”. Будем доказывать (16. 12) в предпо- 
ложении, что E={(y, 2): =], =} и Е*=((у, 2): yo= I’, A=}; 
более общий случай доказывается аналогично. Левая часть 
равенства (16.12) есть 


я η--] ; 
НИ г UP emi 20 =, y=f, а = Е} = 


«ᾱ 


n—l 
‘ | : 
= lim — Ув {Y= i, и=Г] с, Сы = 


= и =Ль (Yo =!) сибрь = P(E) P(E’), 


τα" 
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где предпоследнее равенство SHDAB CT LUDS в силу эргодич- 
ности |. 


Замечание. Изложенные здесь идеи принадлежат 
Шеннону [1]. Макмиллан [1], Файнстейн [1] и Хинчин [3] 
дали им точную математическую формулировку. 

Брейман [2] обобщил теорему 16.2, доказав, что C,=C; 
и верхняя грань достигается для некоторого класса кана- 
лов с конечной памятью. По поводу обобщения теоремы 16.3 
см. Адлер [1]. 
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Проблема 


В общих словах теорему кодирования для канала с шу- 
MOM можно описать следующим образом. Сообщения. посы- 
лаются от источника [X, μ] по данному каналу [Y, v,, 2] кад- 


ресату (рис. 8). Мы должны вставить в схему кодирующее 


Алфавит 6 


Алфавит р Алфавит τ 


Коди- 


рующее 
устройство 


Пространство Х Пространство У Пространство Ζ 


as канал 


Рис. 8. 


устройство, которое будет работать эффективно. Эффектив- 
ность измеряют скоростью, с которой информация пере- 
дается от источника к приемнику, игнорируя при этом 
вопрос о том, как использовать эту информацию в приемнике 
для восстановления посланного сообщения. 

Код ф из пространства Х в пространство У приводит 
к сложному каналу из Х в Z, т.е. сообщение х посылается 
в кодирующее устройство, после чего закодированное сообще- 
ние у посылается по каналу и на выходе получается сообще-_ 
ние г. Пусть энтропия источника равна А и пропускная 
способность — скажем, стационарная пропускная способ- 
ность — канала равна A. Прямая теорема кодирования 
утверждает, что при й < С существует такой код ф, что ско- 
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———- 


рость передачи по сложному каналу равна А. Обратная 

теорема кодирования утверждает, что при Й > С такого кода ф 

не существует. Есть различные варианты этих теорем. 
Пусть нам дан канал [Y, %,, 2] и код ф из Х в У. Оче- 


видно, ЧТО Ve (x) (* )—ядро и, следовательно, [X, Ve Greece l= 
сложный канал. Рассмотрим для заданной меры μ Ha X 
меру Р на ХХ УХА, определенную формулой | 


Р(АХВХ С) = | Vo (x) (С) в (ах). (17.1) 
АПФ 'B 

Мера Р индуцирует частные распределения Py, Рхху UT. д. 
Заметим, что Рх=и, Py=Pyqg'!=ug" [так как Р(АЖВХС)= 
== P(ANo"'B x YX C)] и Pxxz задает совместное распреде- 
ление на входе и выходе для источника [X, μ] и сложного 
канала [Х, Vo x), ZI. 

Пусть Ар— энтропия источника, С,— стационарная про- 
пускная способность канала [У, v,, 7]. "Скорость передачи по 


сложному каналу[Х, vow, 7] (с мерами Px, Pz, Рхха) для 
источника [Х, Г есть 


R, =h(Tx) + h(Tz) —h(Tx x2). 
Ненадежность есть величина 
в (Тх) — В, =й (Тхх2) — (Τα), 


на которую эта скорость меньше энтропии источника [Х, μ]. 
Мы ставим перед собой задачу разыскания кода, при кото- 
ром скорость высока (ненадежность мала), игнорируя при 
этом, как уже отмечалось, проблему, заключающуюся в BOC- 
становлении х по 2. 


Простое обращение 


Следующий результат является частным случаем тео- 
ремы 17.3. 


Теорема 17.1. Если код ф обратим no отношению к Ц, 
то В, < С,. Следовательно, при h>C, не существует кода, 
обратимого по отношению к п, для которого К, =h. 


Доказательство. По определению стационарной про- 
пускной способности скорость передачи по каналу [Y, %,, 2] 
для источника [Y, wo '] есть величина 

в (Ту) + № (Т2) — № (Тух2), 


не превышающая С,,. 
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Следовательно, достаточно доказать равенство 
й (Тх) + В (Т2) — № (Тхх2) = В (Ту) +h (Tz) — В (Тух 2). 


(Здесь сдвигу Tz соответствует мера Pz.) Так как по предпо- 
ложению код ф обратим, то сдвиги Ty и Ту изоморфны и, 
следовательно, й (Тх) =й (Ту). Таким образом, нужно только 


доказать, что 
h(Txxz)=h(Ty xz). 


Но если 7x изоморфен Ту относительно TPOHKH(X,, Yo, Qo), 
_ то, как легко видеть, Ty xz изоморфен Ty xz относительно 
тройки (Хх, YoX Z, Wo), где $ (х, г) = (Фх, 2), и теорема 
доказана. 

° В случае когда [Y, v,, 2]-—канал без шума, теорема 17.1 


сводится к теореме 15.1. И снова для доказательства необ- 
ходимо инвариантное определение энтропии. 

Если мы предполагаем, что pw эргодична, то и ug! эрго- 
`дична, и в этой теореме можно заменить С; на C,. Заметим, 
что мы не предполагали, что ф— код без предвосхищения. 

На практике проблема декодирования заключается в вос- 
становлении х по 2, а не по у, ибо предположение обрати-. 
мости в теореме 17.1 неестественно. В теореме 17.3 это 
предположение снимается. 


Комментарии к прямой теореме для канала без памяти 


Нам представляется соблазнительной попытка доказать 
для канала без памяти условный результат, подобный „тео- 
реме“ 15.2. Наше предположение таково: 


Гипотеза. Источник [X, в] имеет энтропию h, и сдвиг Tx 
с мерой μ. изоморфен любому сдвигу Бернулли с энтро- 
пией h. 


Ясно сознавая, что нам не удастся дать для нижесле- 
дующей „теоремы“ ни условного, ни безусловного доказа- 
тельства, мы все же сформулируем утверждение и иссле- 
дуем возникающие весьма поучительные трудности. 

° Напомним, что структура канала без памяти ‘задается 
(3 X И-матрицей (cj), описанной в $ 16, и пропускная спо- 


собность С=С,= С; дается максимумом величины (16.5). 


„Георема“ 17.2. Пусть имеется канал без, памяти, 
источник [Х, wl] удовлетворяет высказанной гипотезе 
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и h<C. Тогда существует такой обратимый по отношению 
к в код ф, что скорость πε ped get К, по сложному каналу 
равна В. 


Рассмотрим сначала специальный канал без памяти 
[У, у,, 2], для которого можно провести доказательство, — 
канал из примера 16,3. Пропускная способность этого канала 
равна In3. Если A<1n8, то для р. =0 и подходящим обра- 
зом выбранных ру, Po и Ps величины (16.9) и (16.10) прини- 
мают одинаковое значение ft. Пусть у — мера на простран- 
стве У, которая делает сдвиг Гу сдвигом Бернулли (ру, ..., ра). 
Тогда A(Ty)=h, скорость передачи по каналу [Y, v,, 2] 
для источника [У, y], равна A и ненадежность исчезает. По 
предположению существует код ф (из Х в У), обратимый 
по отношению к μ, такой, что у=иф". Из обратимости 
кода ф следует, как и в доказательстве теоремы 17.1, что 
скорость передачи по сложному каналу для источника [Х, μ] 
имеет то же значение A, что скорость передачи MO каналу 
[У, v,, 2] для источника [У, μφγ]]. 

Это рассуждение работает, если только канал обладает 
тем специальным свойством, что при А < С существует на У 
мера Y, удовлетворяющая условиям: 

1) Ty -— сдвиг Бернулли относительно меры у; 

2) [У, y] имеет энтропию й; 

3) скорость передачи по каналу для источника [У, у] 
равна A (или, что эквивалентно в силу условия 2, ненадеж- 
ность равна 0). 

Этим свойством обладает канал из примера 16.3 и любой 
канал без шума („теорема“ 15.2), но им не обладает общий 
канал без памяти — например, в случае, когда все Cj, строго 
положительны. 

Для общего канала без ‚памяти можно доказать, что 
при < С существует мера y на пространстве У, удовле- 
творяющая условиям 2 и.З. Однако для того, чтобы про- 
вести наше доказательство полностью, необходимо при не- 


выполнении условия | усилить основную гипотезу таким. 


образом, чтобы обеспечить изоморфизм сдвигов Гх (с мерой μ) 
и Гу (с мерой у). Для того чтобы превратить „теорему“ 15.2 
в настоящую теорему, скажем, для перемешивающего мар- 
ковского источника [X, ц|, нужно потребовать полноты энтро- 
пии для перемешивающих сдвигов Маркова. Для того чтобы 
превратить „теорему“ 17.2 в настоящую теорему для того же 
источника, нужно потребовать полноты энтропии для неко- 
торого более широкого класса сдвигов — достаточно широкого, 
чтобы включить сдвиг Гу с мерой у. 


~~ 
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te ee ee 


Эти замечания предлагают некоторую возможную про- 
грамму доказательства прямой теоремы кодирования для 
канала без памяти. Параграфы 18 и 19 можно рассматри- 
вать как конечное конструктивное приближение к этой про- 
грамме: мы построим меру Y, приближенно удовлетворяющую 
условиям 2 и ὃ, и затем построим почти обратимый код φ, 
переводящий и в у. 


Усиление обращения * 


Теорема 17.1 показывает, что если между источником и 
передатчиком действует обратимый код, то скорость пере- 
дачи от источника к приемнику не может превышать про- 
пускной способности канала. Интуитивно ясно, что это утвер- 
ждение должно быть справедливо и в случае необратимого 
кода, и в случае случайного кода. Случайный код — это 
просто канал [X, б,, У]; если его ядро &,(.) есть единичная 
масса в точке фх, то мы имеем снова обычный код ф. Слож- 
ный канал, который получается в результате введения слу- 
чайного кода, — это канал [Х, В,, Z], где ядро B,(-) опре- 
деляется формулой 


В» (С) = | 5, (49), (©). 
у 


(Заметим, что В, (С) — измеримая функция от x.) Мы покажем, 
что скорость передачи по каналу [Х, В,, Z] для источ- 
ника [X, μ] не может превышать скорости передачи по каналу 


[У, у,, 2] для источника [Y, A], где ^(В) = | w(dx) 6, (B); 
ae 


разумеется, это вторая скорость не может превышать ста- 
ционарной пропускной способности С, канала [Y, Ἐς, СК 
Определим меру Р на XXYXKZ ‘формулой 


РАХВхС)-| | J w(dx) с, (dy) v, (da) = 


A BC 
=| { w(dx)f, (dy) v,(C). (17.2) 
А В 


[Если код [X, ζ., У] не случайный, то (17.2) сводится к (17.1).] 
Пусть -— поле событий, наблюдавшихся в момент времени 0, 
для пространства Х, вложенного в произведение ХХ УХА, 
т. е. %-— конечное подполе поля ΧΩ © с атомами 
{(x, у, 2): x, =i}, [Е 0. Аналогично пусть F и 6 — поля собы- 
THM, наблюдавшихся в момент времени 0, соответственно для 
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X ий, вложенных в ΧΧΥΧ А. Если Т-— сдвиг на ХХУ 2. 
(с мерой P, определенной формулой (17.2)), то две упоми- 
навшиеся выше скорости есть 


R(x—>z)=h(A, T)+h(S, T)-h(A VG, T) 


R(y—>z)=h(F, T)+h(S, N—-h(P VE, 7). 


Мы хотим доказать интуитивно ясное соотношение R(x > г) < 
< R(y—2z), которое сводится к 


h(AV ὅ, T)-h(A, TI SA(BN S, T)—h(F, T). (17.3) 


Ἡψύετ» Gye VV" PAGS У Тая ν Т"5’; заме- 


п=-—оо п=-—о n=-—co 
тим, что, например, „2 состоит M3 множеств вида AXY XZ, 
где А принадлежит &. Основной факт, который мы исполь- 
зуем, заключается в том, что если М = Zo, το 


Р{М 1.2 ν Yot =P {ΛΙ ||2/ᾳ} п. в. (17.4) 


Это соотношение, аналогичное. свойству марковости, выте- 
кает из (17.2): если М = ХХ УХ С, то общее значение правой 
и левой частей равенства (17.4) в точке (x, у, 2) есть v,(C). 


В силу (12.5) имеем A(AVS, TI=H(AVE|A VE), 
где «= V/Tr"Aue = Ne T°@. Тогда по теореме 12.3 


п<о Ξ 
h(Av ἕ, T)= H(AV δ 146 VE )= iu ν L+H (ALA). 
Аналогично 
(®\У?, Т)\=Н(® УЗ VE)=H(E|F VY)+H(FIB>). 


Наконец, й(%, T)=H(A|A) и h(B, Т)=Н(®|%). Πο- 
этому (17.3) эквивалентно неравенству 


Н (8 |6 У) >Н(8 |e νὴ. 
Так как в силу свойства (С.) из $ 12 
Н (6 | У) > Н(8|[6 V%V%), 
то вся задача сводится к доказательству равенства 
Η(΄|ἕ νυν νὸ-Η(Θ|ἕ V%). _ (17.5) 


Если мы покажем, что 


Н (5 |9" У 4 Уч) =Н (9 |S" У о), (17.6) 
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Ξ τ 
где @ = \/ ТТ", то справедливость соотношения (17.5) 
—п<Е<0 : 


‘будет следовать из теоремы 12.1. Но в силу свойства (Οι) 
из $ 12 соотношение (17.6) представляется в виде 


HEVE"| LV %)— HE "| LV %) = 
=H Ve"|%)— ne Y). 
И, наконец, в силу (17.4) имеем _ 
H(S™ |. У 9) = Н(8 |9) 


Ну" 1.9 ум) =Н(@ У OY). 
Мы доказали следующий результат. 


Теорема 17.3. Для любого случайного кода Ю (х—>2) < 
<R(y—z)<C,. Если й- энтропия источника [X, и|- превы- 
шает С, то не существует случайного кода, для которого 


Ю (х—>2г)= И. 


Замечание. Теоремы 17.1 и 17.3 по существу содер- 
жатся в результатах Пинскера [1]. 


$ 18. ТЕОРЕМА ФАЙНСТЕЙНА 


Вернемся теперь к анализу прямой теоремы кодирования 
для канала с шумом. Ограничимся рассмотрением канала 
без памяти. Сама теорема приводится в § 19. Здесь мы 
‘докажем два предварительных результата, принадлежащих 
Файнстейну. 


Решающая схема 


Канал без памяти задается ($ Ж θη -матрицей (c;,) из $ 16. 
Его пропускная способность C=C,=C, eCTb максимум выра- 
жения (16.5). 


Теорема 18.1. Рассмотрим канал без памяти с про- 
пускной способностью С. Если 9<=< С, то существует такое 


положительное целое число b,(e), что σ᾽) при δ δι(ϑ). 
состоит из М различных точек uy, ..., Uy, а т’ распадается 
на М непересекающихся множеств И’, ..., Vy, гдещи И, 
таковы, что 

PAZ: 53 сане Vil Je 93 Yp) = Uj} > рев, [= E, see) N, (18.1) 
| 


а А? (18.2) 
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Если и!=(/,.... jp) EO’, то левая часть неравенства 
(18.1) есть просто | | 
De С 
ПЕ, ЕЙ ᾿ρξρ» 
где сумма берется по наборам (Κι, ..., Кь) из подмноже- 


ства И; множества т. Следовательно, условные вероят- 
ности определяются только каналом, так что теорема при- 
менима к любой мере у на входе У. 

Сущность этой теоремы состоит в следующем. Допустим, 
посланное сообщение (у, ..., У») получено в виде сообще- 
ния (21,..., 25). Если известно, что (и, ..., и) — один из 
наборов Про. ., "μα ἴδῃ, =, г,) принадлежит У’, то в силу 
(18.1) представляется разумным предположить, что (/1, ..., Иь) 
есть действительно набор и;. И если источник может коди- 
роваться обратимым или почти обратимым образом, причем 
так, что переданное сообщение с большой вероятностью при- 
надлежит {и!,..., Uy}, то посланное источником сообщение 
должно с хорошей точностью восстанавливаться по получен- 
ному, и, следовательно, ненадежность должна быть малой. 
Наборы и; и И, дают схему для решения вопроса о том, 
каково было переданное сообщение. (См. обсуждение ско- 
рости и ненадежности в $ 16.) Ста идея лежит в основе 
теоремы кодирования следующего параграфа. 

Идея доказательства теоремы 18.1 такова. Предположим, 
что алфавит O содержит ровно две буквы, скажем, 0 и 1. 
Пусть 6 — четное число, b = 2a, и пусть последовательность и! 
состоит из а нулей, за которыми следует а единиц, a после- 
довательность Uy состоит из а единиц, за которыми следует 
а нулей. Если 6b велико и (и, ..., и) =и, то с высокой 
условной вероятностью частоты в (21, ..., 2.) почти совпа- 
дают с первой строкой матрицы (с ;„), в то время как частоты 


В (2.4, ..., 2p) почти совпадают со второй: строкой матрицы. 
Если (У, ..., Уь) = Ио, то верно то же самое, но две первые 
строки матрицы (с) меняются местами. Так как эти две 


строки различны (если только пропускная способность не 
равна 0), то распределение (21, ..., 2,) при условии (ит, ..., Ив) =U 
сильно отличается (при большом b) от распределения при 
условии (у, ..., и) = и в силу того, что нули и единицы 
расположены в {1 и Uy не одинаковым образом; и это по- 
зволяет нам найти непересекающиеся множества У, и Vo, 
для которых имеет место (18.1). Доказательство опирается 
на Тщательный анализ условных распределений на выходе 
и большого класса различных входных последовательно- 
стей. 


188 ` ГЛ. 5. КОДИРОВАНИЕ 


Так как заключение теоремы 18.1 тем сильнее, чем меньше г, 
то, доказывая ее, можно предполагать, что 


0<е< =. 


Поскольку результат не зависит от того, какова входная 
мера \, можно выбрать ее так, чтобы упростить доказа- 
тельство. Выберем меру у так, чтобы и, были независимы 
относительно y, причем y {y= j} = p;, где py, ..., Ps выбраны 
так, чтобы функция г(ру,..., Ps), определенная формулой 
(16.5), была максимизирована. Тогда в силу теоремы 16.2 


С=Н(0)—Н (0 |1), 
де. дк = > PjC je, Величина 
1 


Н (0) = 2 η (9%) 


— энтропия на одну ΟὝΚΗΥ Ha выходе канала, а 
Н (О) = =. р (су) 


— условная энтропия на выходе при фиксированном входе. 
(Везде в доказательстве индекс | пробегает алфавит о, 
а индекс К пробегает алфавит т.) 

Выберем A так, что 


АР. <: (18.3) 
где $ — объем алфавита о. Далее, выберем К так, что 
— 3sa Ὁ ша, <К (18.4) 
И : 
— ЗА? Σ шс»<К, (18.5) 


где суммы берутся только по тем №, для которых 4» >0, и 
по тем (|, К), для которых с >0. Наконец, выберем -поло- 
жительное целое число 6, (=) Tak, что при 6 2, (г) (что мы 
в дальнейшем будем предполагать) | 


In (4/6) ἠ-9Κ γ΄ δ. 
ST В. (18.6) 


Обозначим символом П меру на о?Х т’, индуцированную 
набором (/1,..., Ув, 21, .... 2): 


П(Е=Р\и, .... ура... 29) SE}, ECO’ Χ τ’. (18.7) 
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Мера II приписывает точке (], ayes lo» Κι, ..., Rp) массу 
Pi, «++ Рьспь, --: Су. Если Вс о’ [с=т'], будем писать 
П(В)[П(С)] вместо П(Вхт’)[П (0? Х C)]; это не должно 
привести к путанице. Наконец, для Сс т’и ие о’ мы пишем 


П, (С) aa P (21, А 2ь) = ς |(νι» ee ey Y») πες и}. (18.8) 
Если u=(ji, . ie? |»), то очевидно, что Ц, (С) есть ЗЕ СПЕ» 
где. суммироение ведется по всем (kj, ..., Ry) из С. 


Для ие о’ и | ео пусть’ М (1 [и) Е число KOM- 
понент набора и, равных |; аналогично для vet и ВЕТ 
пусть N(k|v) обозначает число компонент набора ч, рав- 
ных k; наконец, для ие 0’, ver, j@o u Еет пусть 
N(jk|uv) есть число тех [, 1<1<Ь, для которых /[-е ком- 
поненты наборов и и Ὁ равны соответственно j и К. Тогда 


11 (v) = exp YN (E10) In % (18.9) 
II, (о) = exp 2 N (jk шо) In ¢ jp. (18.10) 
J ; . 


Говорят, что и есть р-последовательность, если 
М (и) — bpj|<4Vb 


для всех j G0; говорят, что последовательность о порож- 
дена последовательностью и, если 


LN (jk шо) — NG Шо |<AV м (и) 


для всех jeo И het. 

Нам потребуются следующие четыре леммы, из которых 
первые две непосредственно вытекают из неравенства Чебы- 
шева и условий (18.3). 


Лемма [. Если $ — множество р-последовательностей, то 


+ J 


LLCS) Loe oe 


Лемма 2. Если ие последовательностей 
из τ᾽, порожденных последовательностью и, TO 


Н,(@)>1 ==: 
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΄ 


Лемма 8. Если последовательность Ὁ порождена не- 
которой р-последовательностью, то 


П (5) < ο-ὐΗ (O)+KV 


Лемма 4. Если B,—4ucao элементов множества G,, 
то для каждой р-последовательности и 


В, < ен O1D+K V5 


Для доказательства леммы 3 заметим, что если и по- 
рождает v, то 


N (blo) = ΣΙΝ шо) > УХ [М (lu) oe - УМ), 
в то время как если и есть р-последовательность, то 


Бр ЛУ O<N(jlu)< bp; taV < 2, 


так что 
М (|) > > A pen sh VO— оз Vb> > 654, — 35%" Vb. 


Отсюда и из з (18.9) и (18.4) следует лемма 3. 
Для доказательства леммы 4 заметим, что. если и есть 
р-последовательность и она порождает v, TO 


N (шо) <N (Пи) св +AVN (||) < 
τώρ, 4 AVE) еж» У 6p) +2 Vo< 
bp jj, t+ 3n" Vo, = 
так что в силу (18.10) и (18.5) 
Π, (ο) > e-bH OLD-KVE 
Так как II, (G,)<1, To лемма доказана. 


Для доказательства самой теоремы 18.1 рассмотрим эле- 


менты и, ..., Uy из σ᾽ и подмножества V;,..., Им из 7’, 
удовлетворяющие следующим четырем свойствам: 

1) каждая и, есть р-последовательность; 

2) П, (У)>1—в для каждого J; 

3) каждое подмножество Г; состоит из последователь- 
ностей, Е. последовательностью и; и не содержа- 
щихся в У; 0... ПУрь т. е. Vi=Gy,—(ViU. ‚ ЧУ; 

4) не а Une WH Vyas nae {ΤΟ Uj, 6.03 Ими 

ty sees Να УДовлетворяют условиям |, 2x 8. 
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В силу лемм Ги 2 такие и; и У, существуют (быть 
может, при N=1). Затем если и есть р-последователь- 
ность, не принадлежащая множеству и|, ..., Uy, TO 


п, (GN (Vi... UV) )>>- (18.11) 
В противном случае ‘мы могли бы взять их. =U и 
Ухн= Ga—(ViU... UV), 


противоречащие условию 4, так как по лемме 211, (Vyii)= 
=I, (G,)—-U,(G,NWViU.. ‚- ЧУм) ) >1-—=/2—=/2=1—8. С ad 
гой стороны, если и принадлежит множеству WwW), ... 
скажем, и=и, το II 4G. Vi: ПУ) = Ни у) 
>1—e>e/2. Таким образом, неравенство (18.11) выполняется 
для любой р-последовательности и. 

Поэтому 


1(V,U...UVy)> σπωπ,ν,υ ИН 
ие 


в силу леммы 1. Из леммы 3 следует, что число элементов 
в объединении V,;U...UVy не меньше 


© δη (Ογ-ΚΥ δ᾽ 
4 e 


Но в силу леммы 4 число элементов V,U... UV y не больше 
Neb ©11+КУБ.. | 


Комбинируя эти оценки и используя (18. 6), получаем 


№ = 7 ebe-2K Vo > eb (0-8) 


чем доказательство завершается. (Если множества И; He 
исчерпывают всего т’, дополним одно из них.) 


Применения 


Вспоминая еще раз, что теорема 18.1 справедлива при 
любой входной мере у на пространстве У, предположим, что 
для входной меры 


Р{(уь, ..»» Yo) ΕΞ {u, v8) им} } = 
= V{(y1, $2939 Yr) ΕΞ {uy, ee ey ик} } =1. (18.12) 


Наш ближайший результат состоит в том, что в такой обста- 
HOBKe переданному сообщению (/1,..., И») отвечает лишь ма- 
лая неопределенность, если полученное сообщение (21,..., 2ь) 
известно. Остается проблема конструирования почти обра- 
тимого кода, для которого свойство (18.12) выполняется, 
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Теорема 18.2. Для и; и И; из теоремы 18.1 справед- 
ливо неравенство 


Н (yi, ..., У ..., 2) «Π(ε) +та-эЭ-+ёшР (18.13) 
при условии, что выполняется свойство (18.12) u < Це. 


Доказательство. Вспомним, что объем алфавита т 
равен ¢. Мы должны ограничить сверху величину 


A (и, ее |2, Sie: = 2ь) = Н (4 |6”), 
rae Я’ — конечное подполе поля Y Х 5 с атомами 
{(и, 2): (yj, .... %)=и} иео’, а 8”- конечное подполе 
с атомами {(y, z):(Z,..., 2,) = 0}, ое т’. Пусть ® имеет атомы 
B= {yy 2), ие 2... № Нас самом деле 


эти множества исчерпывают! У X Z с точностью до некото- 
рого множества меры 0; объединим это множество меры 0с 
одним из множеств В; (это не внесет изменений в вычисления). 
Наконец, пусть @ имеет атомы С; = {(9, 2):(21,..., 2ο) = Уз}, 
[=1, „И. | 

В ‘силу (18.12) каждый нетривиальный атом поля Φ’ 
отличается на множество меры 0 от некоторого нетривиаль- 
ного атома поля 4, и обратно. Отсюда и из того факта, 
что 6 CG’, получаем 


AY yh Coe θη[δις eon 2) HIBS) =H BIE) < Н (#5). 
(18.14) 


Для любого [в силу (18.1) имеем Р(СВ)>1 Из этого 
следует, что 2 P (Bi) P(Ci | В) <e, и по теореме 6.2 


Η(.42| 6) Ξς η (6) 1- ἡ (1 —2) + а (М — 1), (18.15) 


при условии, что 6 так мало, что функция y(t) не убывает 
на [0, εἰ и не возрастает на [1 —e, 1], что справедливо при 
e<l/e. Для того чтобы получить (18.13), воспользуемся 
‘теперь неравенствами (18.14) и (18.15). 


Замечание. Файнстейн [1, 2] первый доказал резуль- 
таты этого параграфа (для каналов с конечной памятью). 
Приведенное здесь доказательство теоремы 18.1 содержится 
у Вольфовица [1]. Помимо обобщений теоремы 18.1, деталь- 
ное исследование Вольфовица содержит результаты, обрат- 
ные этой теореме, гласящие, что’ если (18.1) справедливо, 
то N не может превышать некоторой верхней грани. С по- 
мощью этих результатов Вольфовиц получил обратную 
теорему кодирования. 
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19. БЛОКОВЫЕ КОДЫ 
Определение 


Рассмотрим канал из предыдущего параграфа — канал 
без памяти— вместе с эргодическим источником [Х, pu] с энт- 
ропией й. Цель настоящего параграфа — показать, что если 
h<C u 6>0, то существует такой код ф без предвосхище- 
ния (из Х в У), что если сообщение х посылается по слож- 
ному каналу, то скорость превышает h— ὃ. 

Мы докажем теорему в терминах 5-блоковых кодов. 
Пусть для любого п 


Арне (нь; 
sorta =: Хо Sor ЛЬ. есть элемент пространства x 
последовательностей элементов ИЗ р. Аналогично определим 


ῇ, Y, 2, Ζ. Под 6- блоковым кодом ф мы понимаем отобра- 
жение ф: ХУ, определяемое (измеримым и стационарным) 


кодом @: Χ-»Υ с помощью формулы 


((ΦΧ)ηνε» sey φΧ)ην:ο) = (PX) n- 


`Заметим, что 6-блоковый код измерим, HO He вполне ста- 
ционарен, будучи стационарным только для блоков длины ὖ, 
Te oT yx = Туфх. Если ф— код без предвосхищения, TO 
Ь-блоковый код ф также называют кодом без предвосхище- 
ния. (В этом случае передатчик должен запаздывать по вре- 
мени на Db единиц по сравнению с источником. Если даны 


...› Xno-1) Xnp, Т. ©. известны ..., Xn-o Xn-1, TO кодирующее 
устройство может выдать блок ἴῃ: кодированного сообще- 
ния и буквы Y(p-1) ...› Ишь Этого сообщения могут быть 


переданы в течение следующих 6 единиц времени.) Код, 
который мы получим, зависит только от настоящего в том 
смысле, что (PX), зависит только OT Хи. 

Так как код ф нестационарен, предыдущие определения 
скорости, ненадежности и т. д. непосредственно неприме- 
нимы. Мы определим эти величины для х, и, 2, разделив 
на 6 соответствующие величины для Х, 1, 2, хотя нетрудно 
видеть, что такие пределы, Kak Ити-!Н (21, ..., Z,), сущест- 

п 


вуют в любом случае. 


Прямая теорема в терминах блоковых кодов 


Теорема 19.1. Рассмотрим канал без памяти и некото- 
рый эргодический источник |X, μ]. Пусть С — пропускная 
способность канала и й- энтропия источника. Если h<C 


13 Зак. 1491 
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ae 


4 
и 6>0, то для некоторого b существует такой 6-блоковый 
код ф, что скорость передачи сообщения х по сложному 
каналу превосходит й—5. 


Доказательство. Выберем 8 так, что 
h+e<C—e, 
n(e)+n(l—e)telnt< +, 


ве, 
1 
вот. 


(Как всегда, ги {— объемы алфавитов ф и т.) Все вычисле- 
ния основываются на вероятностях 


P(AXBXC)= | voc (С)и(ах), 
АПФ 'B 


где у,—ядро рассматриваемого канала и ф— тот блоковый 


код, который нужно построить. 
Если Ь превосходит в, (2) из оремы 13.2, то независимо 


OT того, каков код ф, алфавит 0? распадается на два мно- 
жества Н и L так, что . 


PF Ax; ee eg x») EL}<e 


PARE Ee ΧΕ 9} > he (19.1) 


для любого ш=Н. Если b превосходит Ь, (=) из а. 
18:1 и. 18.2, το 


Η (νι, oy уь| 21, eis Δ 2ь) “η (6) +n (1 — 8) +65 Int, (19.2) 
если только код ф таков, что (ит, vie ey Yp) С ТН | 
принадлежит множеству элементов Uj, ..., Им Из о?. На- 


помним (см. (18.2)), что 
№ — 28499. 


Выберем и зафиксируем некоторое число 6, превышающее 
и Ob (), и ὑι(ε). Далее, из (19.1) следует, что число эле- 
ментов множества Н меньше, чем οὖ (118) < её (C2) < М. По- 
этому существует отображение 1, переводящее 0’в σ’ так, 
что множество Н отображается взаимно однозначно на соб- 
ственное подмножество 4ф(Н) множества {и1,..., ик} и все 
элементы множества L ‘отображаются на некоторый эле- 
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мент и, не принадлежащий φ(Η). Определим ф (а следо- 
вательно, и @) формулой 


(фХ)„ = ф(Х»). 


По построению Я, принадлежит множеству {и1,..., их}, 
так что в силу (19. 
м М (19.3) 


Если йЙ принадлежит множеству 1ф(Н), то тем самым ἆι 
полностью определен; следовательно, если и =\(Н), то это 
означает, что величина 


pe η(Ρ {== u}) (19.4) 


wep? 
обращается в нуль. Так как о’ Е г?’ элементов, то 


(19.4) во всяком случае He больше шг’. Из соотношения 
Р {j; = p(A)} = P {х, = A} следует : 


На) ше <. (19.5) 
Далее, 
Н (х:|21) < poe й1 |2!) = AG) +A (%1 91, 81) < 
<A (81 |2) + A (%1 1). 


Применяя теперь (19.3) и (19.5), получаем 


H (Χι|Ζι) < 56. 
Но 
n 

Eby oh KA Sig wees δι) SH (ela, sar sae aN -ᾱ 

| р 

> 2 Н (Χι|2ι) = nH (Χι|ξι) 

у i= : 
так что 


— H (i, sag be Riles sey Zn) < 56. 


Переходя к пределу, мы видим, что ненадежность для 
Ь-блокового процесса (х переходит в 2 по сложному каналу) 
меньше чем 50. Разделив на 6, получаем, что ненадежность 
при передаче самого x меньше чем ὃ. Поэтому скорость 
превосходит h — ὃ. 


Заметим, что построенный код ф, вообще говоря, He- 
обратим. Так или иначе это несущественно, ибо проблема 
декодирования состоит в возвращении OT 2 Κ Χ, a He от у 


13* 
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к x. Мы достигли нашей цели, состоявшей в оценке He- 
надежности сложного канала величиной ὃ. 

На протяжении этой главы мы измеряли эффективность 
кода, связывающего источник с каналом, посредством ско- 
рости передачи информации от источника к приемнику. 
В $ 17 мы игнорировали проблему использования инфор- 
мации в приемнике для восстановления посланного сообще- 
ния. С другой стороны, в теореме 19.1 мы теоретически 
строим эффективный код, явным образом сталкиваясь с ука- 
занной проблемой и используя при этом теорему Файнстейна.. 
Однако реальное построение кодов в практической ситуации 
производится совершенно иначе. 

Очевидно, что теоремы 17.1 и 17.8 о несуществовании 
некоторых кодов могут быть также сформулированы в тер- 
минах 6-блоковых кодов. С другой стороны, не ясно, как 
переформулировать теорему 19.1 таким образом, чтобы 
‘обойтись без блоковых кодов. | 


Замечание. Эти теоремы принадлежат Шеннону [1], 
хотя его доказательства были неполными. Файнстейн [1] дал 
первое полное доказательство. См. также Файнстейн [1], 
Хинчин [3], Такано [1], Добрушин [1] и Пинскер [1]. Более 
широкие исследования в теории связи см. у Реза [и 
Мейер-Эпплера [1]. | 
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Указатель примеров 


Пример 1.1 (стр. 11). Двусторонний сдвиг Бернулли. 


О: w=(..., 0.1, ® @, ...), где %*,(@) =, — элемент 
конечного множества о, - 
ТЕ 1 Ope Qu Gert coe Tt. Ὁ яв (Ре) = ἅπη (©), 


P{o: x,(0) =i, n<l<n+h}= aL ри. 


Свойства: обратимый (стр. 13); эргодический (стр. 22); пере- 
мешивающий (стр. 22); №(Т) =— Ур, шр; (стр. 80 и 102). 
: 


- Пример 1.2 (стр. 13). Общий двусторонний сдвиг. 


О: @O=(..., O13, Wp, @, ...), где Χα (о) =, — элемент ко- 
нечного множества о, 
Те = (.. .› Mo, @1, Wo, . = т. е. tq (То) = Xn+l (6), 


P — любая вероятностная мера, сохраняющаяся при 
преобразовании Т. | 


СвойствА: обратимый. 


Пример 1.8 (стр. 14). Нециклическая перестановка. 
0 =4а, 6; ο, d, е}, 
T = (а, 6, с) (а, e), 
Р (а) =Р (ὁ) =Р (с) и P(d)= P(e). 
Свойства: преобразование обратимое; неэргодическое, если 


только P(a)=P(b)=P(c) не равны 0 или P(d)=P(e) не 
равны 0 (стр. 16); не перемешивающее (стр. 22); A(T)= 0. 


Пример 1.4 (стр. 14). Циклическая перестановка. 
={a, 6, с, 4, е}, 
1 = 10,267 c, d,“e); 
| 
Р (а) =Р (5) =Р (с) =Р(а) =Р(е) =. 
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Свойства: обратимое; эргодическое (стр. 16); He перемеши- 
вающее (стр. 22); h(T)= 


Пример 1.5 (стр. 15). Поворот окружности. 


О — единичная окружность в комплексной плоскости, 
То = ζῶ, где с- элемент из Q, 
Р — нормированная круговая мера Hosera: 
Свойства: обратимое; эргодическое в том и только TOM слу- 
чае, если с не является корнем из единицы (стр. 18); He 
перемешивающее (стр. 22); h(T)=0 (стр. 103 и 104). 


Ber 1.6 (стр. 15). Диадическое преобразование. 


= [0, 1] 
Ἐπ 2ω (πιοά 1), 
Р — мера Лебега. 


Свойства: необратимое; эргодическое (стр. 20 и 119); переме- 
шивающее (стр. 22); A(T) = 112. 


_ Пример 1.7 (стр. 28). Casi для вещественнозначного процесса. 


оО ὤξι Ὁ ὧι .. .), где x, (©) = @, — точка веще- 
ственной прямой, 
TO (5. оф Woy ads Ter ©.,.X, 1 £0) —%,,7 (0), 


Р— любая вероятностная мера, сохраняющаяся при 
преобразовании Г. | 


Свойства: обратимое. 


Пример 8.1 (стр. 41). Сдвиг Маркова. 


Частный случай общего двустороннего сдвига (при- 
мер 1.2), задаваемого формулой 


Р{о: Хп+1- 1 (@) = ἦι, [= A; ‚ k}= pi 12111. 5 «Ρις. 126 › 


где р; для матрицы вероятностей перехода (р;;) стационарны 
и строго положительны. 


Свойства: обратимый; эргодический в том и только TOM 
случае, если матрица (p;;) неприводима (стр. 42, 43, 131 и 138); 
перемешивающий в том и только том случае, если мат- 
рица (p;;) неприводима и Bey epuona gee (стр. 44 и 140); A(T)= 


и 2 Pi Piz т pig (стр. 102). 
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Пример 3.2 (стр. 44). Общий односторонний сдвиг. 


О: ® = (©, ©, ...), где х„ (0) = о, — элемент конечного 
множества о, 
То = (Ως, ®з, .. ids т. е. Xn (То) = — Хи+1 (a), 


Р— любая вероятностная Mepay сохраняющаяся при 
преобразовании Τ. 
Свойствл: никогда не обратим; свойства эргодичности и 
перемешивания, а также значения' энтропии совпадают 
с аналогичными свойствами и значениями для соответствую- 
щего двустороннего сдвига. 


Пример 3.3 (стр. 45). 


Частный случай общего двустороннего сдвига (при- 
мер 1.2), в котором исходы независимы, но каждый повто- 
ряется. 

Свойства: обратимый; эргодический (стр. 45); не перемеши- 
5» 1 
вающий (стр. 45); в(Т)=—5 Ур In p; (стр. 103). 


i 


Пример 3.4 (стр. 45). г-адическое преобразование. 


= [0, 1), 
То = го (тоа1), . 
Р — мера Лебега. 


Свойствл: необратимое; эргодическое, перемешивающее; 
й(Т) = шг. 


aes 8.5 (стр. 46). 


=[0, 1), 

(al =ro(mod 1), 

P—s060aa вероятностная ode сохраняющаяся при 
преобразовании Г. 


Свойства: необратимо. 
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Алгебраические автоморфизмы тора 
и цепи Маркова. 
Б. М. Гуревич и Я. Г. Синай 


Как отмечено в предисловии редактора перевода, важ- 
ность изложенной в книге теории объясняется не только ее 
связями с теорией вероятностей, но и возможностью успеш- 
ного применения к изучению динамических систем, порож- 
даемых диффеоморфизмами и векторными полями на глад- 
ких многообразиях. В этом дополнении мы подробно рас- 
сматриваем один весьма популярный пример такого рода —` 
алгебраический автоморфизм тора—и устанавливаем, что 
с точки зрения эргодической теории он изоморфен марков- 
скому автоморфизму (см. стр. 41) с конечным или счетным 
пространством состояний. Читателю предоставляется воз- 
можность самому судить, какая из областей — алгебра или 
теория вероятностей — от этого больше выигрывает. 


$ 1. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ АВТОМОРФИЗМЕ 
п-МЕРНОГО ТОРА 


Тор, М получается из п-мерного евклидова простран- 
ства R”, рассматриваемого как топологическая группа, факто- 
ризацией по целочисленной решетке Z”. Геометрически тор 
можно представлять себе как единичный п-мерный куб 
~~ {0<y,<1; i=1, 2,..., п} ‘с мерой Лебега p, у которого 
отождествлены противоположные (и — 1)-мерные грани. Рас- 
стояние d(x), х2) между точками x, хе М определяется 


равенством 
d (x1, χο) =0(C,,, σε; (1) 


где р-— метрика в R”, a Cy, Cy,—Ksaacchl смежности R” 


по Z”, отвечающие точкам χι, Xo. 
Любая целочисленная матрица А порядка п переводит 


решетку Z” в себя. Если, кроме того, | detA|=1, το τ Ἐκ 
обладает тем же свойством и, следовательно, A отобра- 
жает Z” на себя взаимно однозначно. В таком случае мат- 
puma А индуцирует групповой автоморфизм тора M=R"/Z", 
сохраняющий меру μ. Всякий групповой автоморфизм тора 
получается описанным здесь способом. 
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Будем обозначать л естественную проекцию (естественный 
гомоморфизм) пространства R” на тор, т. е. отображение, 
сопоставляющее каждой точке уе Ν΄ содержащий ее класс 
смежности по подгруппе 7”. Если Аг — матрица, индуцирую-_ 
щая автоморфизм Т, то лАгу=Тлу, уе В". Формула (1) 
с помощью л может быть записана в виде 


4(х, х)= min (у, 45). 
Yi, Yo Лу=хХь, Лу›=хХ> 
Пусть Ay, Ao, ..., А, — собственные значения матрицы Аг 
и п, Πο, ..., п, их кратности. Так как матрица вещест- 
венна, TO каждому вещественному A; отвечает комплексно- 
сопряженное число А; =A;, имеющее ту же кратность, что и 
^;. Приведя матрицу Аг к жордановой форме, мы получим. 
для каждого вещественного A; ий-мерное инвариантное под- 
пространство Н; пространства R” и в H; базис, в котором A; 


№ 
| bay er GE 
имеет вид жордановой клетки Τα ‚Вели Aj, Ape 


пара комплексно-сопряженных собственных значений, TO 
можно найти 2n-MepHoe инвариантное подпространство H; и 
в Нем базис, в котором матрица имеет вид жордановой клетки 


[Δ | 
Е.А; 0 
Е . Reh; eg e % 
- ; 5 BAe м шх Red, | a= 0 l ; 
[о E ‘A, 


Назовем расширяющимся подпространством и обозна- 
чим H, прямую сумму подпространств H; по тем i, для ко- 


торых | ^;|>1. Аналогично сжимающееся подпространство H, 
есть прямая сумма тех H,, для которых |A;|< 1. Из опре- 
деления видно, что Нри Нь инвариантны относительно Аг. 


В дальнейшем мы будем рассматривать лишь такие мат- 
рицы Ar, которые не имеют собственных значений, равных 
по модулю единице. Это условие, очевидно, эквивалентно. 
равенству о 

Н ФН. =К.. 
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Так как | det Ας |=1, то оба подпространства Нри Н. в рас- 
сматриваемом случае нетривиальны. 


Пусть А=. ei 1 | и Up, Ue — лебеговы меры соответ- 
[А >. 


ственно на H, и H,. Пользуясь каноническим видом мат- 


рицы Аг, заключаем, что _для любых измеримых множеств 
Ве Ни ВЫ 


Ир (Αγ By) = Άμρ (B,), Ис ин (B.). (2) 

Выясним теперь поведение длин векторов в простран- 

ствах Нри Н. под действием степеней матрицы Аг. Длину 
вектора у= Κ᾽ будем обозначать | и |. 


Лемма 1'). Существуют такие константы ἄς, Ap, λε <1, 
Л» >1, что для любых векторов у” = Н., у’ ΕΞ: Ηρ и любого 
натурального т . 
mW m и —т 7 -ῃΊ / 
| Ary | < < Ache ly |, |Ar"y | < αρλη ly |. (3) 
Доказательство. Так как дОрОенанОтВ Не WHAT, 


меняются ролями при замене Az на An достаточно доказать 
первое из неравенств (3). Воспользуемся каноническим пред- 
ставлением матрицы Аг в подпространстве H,. Возьмем 
любое 15-20 и сопоставим клеткам 


А, ГА, ] 
ей 0 BA, 0 
[ο т Е 
Ἢ ° у 
а [о АН 


В этом представлении соответственно клетки 
(.4 ΤΕ 
4 0 | Q 0 
9? Q? р 


[ο git] [о gir 


1) Из этой леммы вытекает, что если матрица A, не имеет собст- 


венных значений, по модулю равных единице, то автоморфизм Т явля- 
ется У-системой в смысле Аносова (см. [2] ) 
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где Q=gE. Матрица, состоящая из этих клеток, приводит Аг 
к виду, получающемуся из канонического заменой элемен- 
тов [и E соответственно на ди Q. Пусть ер, ео, ..., Εμ — 
базис, в котором Аг имеет только что описанный вид. Вве- 


k n 
Ὺ 

дем в Н. новую норму, положив || y” |? = >) с?, если у” = Se Ces 
i=1 fod 


Пользуясь тем, что все собственные значения, относящиеся 
к Н., по модулю меньше единицы, нетрудно проверить, что 
если 4 достаточно мало, то || Ar |<1 (в подпространстве H,). 
Другими словами, можно так подобрать № <1, чтобы для 


любого y” Н. 
Ary” ||« му” 
и, следовательно, | 


[Ами m=0, 1,.... 


Интересующее Hac неравенство (3) вытекает теперь из экви- 
валентности любых двух норм в конечномерном линейном 
пространстве. 


Рассмотрим в пространстве Ю” гиперплоскости, парал- 
лельные подпространству Hy, и назовем их расширяющимися. 
Преобразование Ar переводит расширяющиеся гиперплоскости 
друг в друга. То же самое можно сказать и о сжимающихся 
гиперплоскостях, параллельных подпространству Н.. Образы 
при отображении л гиперплоскостей каждого семейства будем 
называть соответственно расширяющимися и сжимающимися 
слоями (на торе). На любой расширяющейся или сжимаю- 
щейся гиперплоскости отображение л взаимно однозначно. 
Достаточно проверить это для расширяющихся гиперплоско- 
стей, так как сжимающиеся гиперплоскости являются рас- 


=] | 

ширяющимися по отношению к Ат. Очевидно, можно огра- 
/ ΄ 

ничиться подпространством Н,. Пусть yj, у, — векторы из Нр 


и πὐ!--πι. Это значит, что у = у, -— у. — целочисленный 


— 0 


[η / 
вектор, также принадлежащий H,. По лемме 1 | Ary; 
при т-> — 00, что невозможно, если у, 50 (в этом случае 


AT — ненулевой целочисленный вектор). Тем самым’ наше 
утверждение доказано. 


Лемма 2. Любой расширяющийся или сжимающийся 
слой всюду плотен на торе. 


Доказательство. Здесь снова достаточно рассмотреть 


слой tH,. Пусть tH,)—ero замыкание. Множество лНр является 
замкнутой связной подгруппой тора М, инвариантной OTHO- 
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сительно автоморфизма Г. Факторгруппа М/мНь имеет тогда, 
как известно, вид M/nH, где Н — замкнутая подгруппа 
группы А", содержащая H, и целочисленную решетку Ζ΄ и 
инвариантная относительно Αν При этом обе группы М/жН 
и R"/H изоморфны тору некоторой размерности #<и (cm. 
[4, гл. 7, $ 1, п. 5]). Покажем, что R=0. 

Введем метрику 0’ в группе Ю”/Н, положив расстояние 
между двумя ее элементами равным расстоянию в R” между 
соответствующими смежными классами. Пользуясь инвариант- 
ностью подгруппы Н относительно Аг, перенесем это пре- 
образование в Ю”/Н, где оно останется гомеоморфизмом. 
Возьмем любые два смежных класса С; и Cy из ΝΗ. Не- 
трудно найти точки y,;]C, и YoSCo,. проекции которых 
на H, совпадают. Отсюда следует (см. emmy 1), что 


ρ΄ (Α7Οι, АТС) 0 при. т — oo. 


Но в силу компактности группы Ю”/Н это возможно лишь 
в случае, когда множество Ю"/Н состоит из одной точки, что, 
и требовалось доказать. 


$ 2. МАРКОВСКИЕ РАЗБИЕНИЯ И Е hese open СВОЙСТВА 
АВТОМОРФИЗМОВ ТОРА 


В этом параграфе мы введем марковские разбиения и 
докажем с их помошью ряд эргодических свойств автомор- 
физмов п-мерного тора. Существование марковских разбие- 
ний будет установлено в следующем параграфе. Напомним 
еще раз, что по предположению все собственные значения 
рассматриваемой матрицы Аг не равны по модулю единице. 

Пусть V’, И” — измеримые ограниченные множества в под- 
пространствах H, и Не соответственно, ИУ’, IntV” — их 


открытые ядра 6 ὁδαοπιέϊναὸ к Ηρ Ἡ H,) Ἡ δν’ = VEN Int VS 


ду” =V"” \ IntV” — ux границы (черта обозначает замыкание). 
Назовем множество 


V Pam (V’, у”) а {уе р". y= у Ae if? ye у". у” — Vv” 2 


параллелограммом в В", если и (0У’)=и. (9У”)=0. Образ 
параллелограмма V CR” при отображении л будем также 
называть параллелограммом, если л на множестве У является 


1) Здесь и, и’, У” обозначают п-мерные векторы, В дальнейшем будет 
употребляться запись y= (у, Я 


14 Зак. 1491 
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гомеоморфизмом. В этом случае 
и (лИ) = ув, (У) ше (И), | (4) 


где Y--KOHCTaHTa, зависящая OT угла между подпростран- 
ствами Нри ΗΚ. Легко видеть, что пересечение двух: парал- 
лелограммов в Ю” есть снова параллелограмм. 

В дальнейшем мы будем пользоваться следующей лем- 
мой, доказательство которой несложно и предоставляется 
читателю. 


Лемма 3. Пусть 8 = bee (Ant | Az" ἡ Ц ie И. — связ- . 
ные параллелограммы на торе, диаметры которых меньше 1/46, 
причем И›=лУь, где У» — связный параллелограмм в а 
Тогда найдется такой связный параллелограмм У; <= К", что 
U,=aV,, (ПТО. =л(У ПАУ.) и на множестве V,U Αγγ. 
отображение л является изометрией и, следовательно, гомео- 
морфизмом. Утверждение останется справедливым, если за- 


‹ ; . -ἱ -] : 
менить в нем Τ᾽ и Ap соответственно на Τ᾽ и Аг. 


Граница OV параллелограмма У < К" совпадает с объеди- 
нением множеств I’, (V)=(V’, OV”) и Г. (У) =(0V’, У”). Первое 
из этих множеств будем называть расширяющейся границей, 
второе — сжимающейся. Аналогично множества лГ,(У)=Г, (лу) 
и лГ.(У)= Г. (nV) образуют соответственно расширяющуюся 
И сжимающуюся границы параллелограмма лу. 

Будем называть расширяющимся слоем параллелограмма 
У<Ю” пересечение любой расширяющейся гиперплоскости 
сии граничным расширяющимся слоем — пересечение рас- 
ширяющейся гиперплоскости с Г, (И). Аналогично определим 
сжимающийся слой и граничный. сжимающийся слой парал- 
лелограмма У. Отображение л переводит все указанные слои 
в одноименные слои параллелограмма И =лИ. 

Определим теперь разбиение тора на параллелограммы. 
Так мы будем называть конечную или бесконечную последо- 


вательность  параллелограммов И; = М, удовлетворяющую 
трем условиям: 1) U U,=M, 2) Int U;f Int И; = 2) при ij, 


ξ $ 
3) и (U Int U ) = |. Заметим, что & не является, вообще говоря, 
i | 
разбиением в строгом смысле слова; В частности, его эле- 
менты могут пересекаться. Однако все их пересечения со- 


держатся в множестве Г (©) = Uou,, имеющем нулевую меру. 


В случае когда α конечно, р" 1) можно записать в виде 
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Uui= = M, а необходимость в условии 3) отпадает, так как 


Ἐς вытекает из 1) и определения параллелограмма. Положим 
Г, (о) = (Ть(0); г. @=( те (6. 


В случае конечного а очевидно, что 


Ls (a) = О Г (ο), Ἐς (α) as U Ες (U;). 


Определение (cm. [5]). Разбиение % на параллело- 


граммы называется марковским, если ЕР, (a), 
Г. (Га) <= Г. (а). | 


В следующем. параграфе мы покажем, что рассматривае- 
мый автоморфизм Т обладает конечным марковским разбие- 
нием с элементами произвольно малого диаметра. Отсюда 
вытекает утверждение, на котором будет основано дальней- 
шее изучение автоморфизмов тора. 


Теорема 1. Для всякого #>0 существует марковское 
(по отношению к Т) разбиение В, элементы которого В; 
связны, открыты и POORSETGO MES условию diam B;<e, 
J --- К 9, $ о оо 


` Доказательство. Пусть U — произвольный элемент 
конечного марковского разбиения α. Открытое ядро ШИ 
параллелограмма О также является параллелограммом. 
Разобьем множество Int U на связные компоненты, их может 
быть конечное или счетное число. Нетрудно проверить, что 
каждое из получившихся множеств — открытый параллело- 
грамм и эти множества образуют разбиение тора на парал- 
лелограммы. Обозначим это разбиение В. Тот факт, что оно 
марковское, вытекает из марковского свойства разбиения α 
и соотношений Г, (В) = Г, (©), Г. (В) = Г. (a). 


Основной результат этого параграфа содержит 


Теорема 2. 1) Автоморфизм Т изоморфен сдвигу Map- 
кова с конечным или счетным множеством состояний. 
2) В ie О λ.-: 1 hi) 3) Т является 
К-автоморфизмом (см. определение на стр. 111). 


Доказательство. 1) Пусть В — марковское ‚разбиение, 
описанное в теореме 1, B,, Bo, ...—ero элементы, являю- 
щиеся открытыми связными параллелограммами, причем о 


14* 


x 
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diam В, < 1/26, i=1, 2,... (ὃ определено в лемме 3). Введем 
матрицу пересечений $ = (5,1), где’ 


© если В: ПТВ;=0@, 

" |0, если В. ПТВ, = 6, 

и рассмотрим в пространстве © бесконечных в обе стороны 
последовательностей натуральных чисел множество Qs, со- 
стоящее из тех последовательностей в = {wz}, для которых 
Зо — © << с. Нетрудно проверить, что Ως изме- 
римо, т. е. принадлежит о-алгебре #, порожденной цилиндри- 


ческими множествами, и инвариантно относительно сдвига Г, 
переводящего последовательность ® = {o,} вю (Ων), где 


_ К 
Е 


Покажем. что для любого т > 0 и любой послелователь- 
HOCTH © = {ως} S Qs в R” найдутся такие параллелограммы 


Co, == (Co, С ® Co, = (Οὐ; Со), что 
| Ba о Bol С (5) 
m 
П ΓῆΒω, =л (Сь, ATCa,), ATCo, с Са, 
Пусть т-= 1. Пользуясь леммой 3, найдем в R” парал- 


лелограммы Со, = (Св, Сы) и Сь =(Сь, Са), для которых. 
Bao, = πίων» Bo, ays πίω, Bo, П Т Bo, = I (Co, П АтСь) 


и на Со 0 АтСь отображение л является гомеоморфизмом. 


о Тогда множества wee ео Ar. he Cod CBASHDI И открыты 


(в. соответствующих подпространствах) и. Сы П:Атб @: 
Со ПАтСь -- ©. В силу марковского свойства разбиения В 


Г (ТВо) ς- Гс (В), 
а потому | 
д (АтСь,)П Сы, = @. * (6) 
Отсюда следует, что 
бы АтСь. (7) 


В самом деле, если это не так, возьмем любую точку из 
ὍΣ Й (H, \ ArCo,) и соёдиним ее непрерывной кривой, лежащей 
в Co, с какой-нибудь точкой из Со, 'АтСь. Ha этой кривой 


обязана найтись точка из Аг(0Сь) = д(АтСь,), что противо- 
речит равенетву (6). | 
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Аналогичные рассуждения, но с использованием условия 
- 
ВР Bo) = Г, (В), показывают, что 


Або бы (8) 
Из (7) и (8) вытекает, что 


CoM ArCo, = (Са, [| ArCo,, Сы П АтСь,) = (Св, АтСь), (9) 


т. е. при m=1 наше утверждение справедливо. По индук- 
ции легко доказать его для любого т_>0, пользуясь инва- 
риантностью' множества (ἧς относительно T. 

Совершенно так же нь что в Κ΄ сущест- 


вуют параллелограммы Do _=(Do,, D ος) Πω = = (Do т’ Do_,,)s 
для которых 
Bo, =л)о, Bo_n= п, 


5” ο | 10 
ῃ fA в. ‚=л(Аг” Do ΞΕ, ь ), Ат Do_, oe Do, ( ) 


При этом можно считать, что Do, = Co, Заменив обозначе- 
ние До_„ на Co_, комбинируя (5) и (10), получим равенство 


т м 
П Т Во, =л(АТ"Сь „ АТСь,), из которого следует, что 
ees 
> т 
множество B,(@)= [] T*Bo, “HenycTo и diam В» (в) < 
k=—m ἃ 


«-(αιλξ' + ар» -”) 26 (cm. леммы 1 Ἡ 8). Тогда nh В» (®) — 


| т| «ου 
единственная точка тора М, и мы можем определить ото- 
бражение ф множества (ας в М, положив | 


or φί(ω) = П Вт (®), oa Qs, 
|m|<© 


Это отображение удовлетворяет условию 
| ф(То) = Тф (®), фЕО.. В 


Покажем, что оно измеримо. Пусть В» — замкнутое множе- 
ство вида П Т'Вь, где В», — mim, — произвольные 
111 < м = 

элементы разбиения В. Если B, == @, то в Qs найдется 
точка ©, для которой В„(о)= Виш. Поэтому diam By, = 
= diam В» (ὦ) Зе», где вт = (же + app”)/25, Занумеруем 
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ть фиксированном т Е By B τ ere anaes 
= k 
ВЯ. Вт, оса И ПОЛОЖИМ Cus aS во = Ви a г .». -- | > ао 


= В \ U Ch .... Множества Ch, k=1, 2,..., He пересе- 


со 

каются и образуют разбиение множества в Bi, на конечное 
k= 

или счетное число борелевских подмножеств, диаметры KOTO- 


рых не превосходят Εμ. Так как u( U U В») -- 1, то множество 
k=l | 


со 
Е 
М \ U Bn. можно разбить на счетное число борелевских 
k=! 
подмножеств произвольно малого диаметра. В итоге мы полу- 
чаем разбиение E, тора М на счетное число борелевских 
множеств, диаметры которых не превосходят е„, причем 


lim =„ = 0. Из определения ф видно, что при любых ти Ё 
{1 -» οο 


множество фо '(В*). есть пересечение некоторого цилиндра 


счете ф “Be 8. Отсюда следует, что прообраз лю- 
бого элемента разбиения E,, принадлежит «Θ, и для доказа- 
тельства измеримости' ф достаточно установить, что совокуп- 
ность элементов всех &„, m=1, 2,..., порождает о-алгебру 
$? борелевских подмножеств тора. Но это непосредственно 
вытекает из доказанной в книге леммы 3 8 δ᾽) 

Итак, отображение ф измеримо, но, как легко понять, 
не взаимно однозначно. Однако для ф можно найти обрат- 
ное отображение, если предварительно выкинуть из тора не- 
которое множество меры 0. В самом деле, объединение 
со 


U Вь элементов разбиения В есть открытое множество меры |. 
k=l : 
κ : со 
Поэтому множество D = П Τ’ Ов», инвариантное относи- 
Jil « © k=1 


тельно 7, является борелевским и также имеет меру 1. 


Ὁ Если ввести 0-алгебру ®,, атомами которой служат параллело- 
co 


граммы В+, В.,... и множество М \ U Bp, TO доказанное утверждение 
\ 4 я 
k=1 
Е 
можно сформулировать в виде равенства \/ \/ I'M, Ж ® (определе- 
Е i=—k 
ние символа 53 см. на стр. 104). 
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В силу измеримости ф отсюда следует, что д=ф-! (р) Φ.. 
Заметим, что любая точка хе имеет единственный про- 
образ фт (©) = Qs. Поэтому на D можно определить отобра- 
жение wp, обратное к ф и переводящее D в 7. Это отобра- 
жение измеримо, так как для любого цилиндра F множество 
ф- (FO D)=o(FND)=9(F)Ng(D)=O(F)ND является боре- 
ам | 
Зададим на о-алгебре меру й формулой 


| (В)=в(ВПБ)=в(Ф(ВПЬ)), Be $. 
Мера п инвариантна относительно. Ти сосредоточена на 


инвариантном множестве Б. Вместе с равенством (11) это 


_ означает, что преобразования (T, ®, и) и (ТГ, B, ii) πβο- 
морфны (см. определение на стр. 66).. 


Покажем, что Т-— сдвиг Маркова. Пусть В, = HC, 
C;=(Ci, eee By (Ci)= 6, We (Cy) = 57 ир,=в(В), Pi, = уз. 
Из (5) с учетом (3) и (4) вытекает, что если В, ПТВ, == ©, то 


ие (CF by 


в (В. П7Ву- тк (Су) в, (С) =в(В, 07 τν u (B i) АБ; ° 
т. е. для цилиндра Е.Л 


fi (F) = μίφ(ξῃ δ))--μίφ(ξ)ῃφ(δ))-- 

-μίφ(ξ)ῃ D) =n (9 (F)) =p (B; ATB,) = pipiy. 
Отсюда, суммируя по. |, заключаем, что Аа P =(p;;) 
стохастическая, 


Чтобы доказать нужное нам утверждение, достаточно 
проверить для любых элементов В: , Ви, ..., В:„ разбиения В 


равенство 
т т-—1 
H(A.) =P, ED Pic Τ 
= k=0 | 


которое, как мы уже видели, справедливо при т=1. Если 
Sites =0 хотя бы при одном kR<m, то обе части равен- 


ства (12) обращаются в 0. Если же Si teat =| при k=O, 


l,..., m—1, то правая часть равна yb BA, а левая 


в силу (5) есть и (л (Co, ATCo,,)) = Y0i,0i,4 Тем самым 
равенство (12) доказано. 
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2) Чтобы вычислить энтропию A(T), вернемся к конеч- 
ному MapKOBCKOMy разбиению 4%. Если его элементы Uj, 
Us, ..., ЦИ; достаточно малы, то всякое пересечение вида 
k 


Пти, (1=0, 1; R=1, 2...) представляет собой паралле- 
i= j 


лограмм. Пусть х — произвольная точка инвариантного MHO- 
жества Ви U(x, i) — элемент разбиения a, содержащий Τ΄χ. 


Рассмотрим параллелограмм Οὐ (x) т“ U (x, i). По лемме | 
i=j 

при k—> оо диаметр любого расширяющегося слоя этого па- 

раллелограмма стремится к нудю, а потому множество 


С, (x)=) Ci (x) содержится в сжимающемся слое паралле- 


лограмма Έ TU (x, j), проходящем через точку x. С другой 
стороны, из соотношения между марковскими разбиениями 
au В вытекает, что C,(x) содержит Оля через х 
сжимающийся слой того элемента разбиения Te iB B котором 
лежит X. 

С помощью проекции л, которая, как мы знаем, взаимно 
однозначна на каждой сжимающейся гиперплоскости, пере- 
несем меру Лебега с этих гиперплоскостей на соответствую- 
щие сжимающиеся слои, сохранив для получившейся меры 
на слое обозначение με. Из построения множеств С, (х) видно, 


что каждое такое множество измеримо на м его 
сжимающемся слое и функции |; (х) =и. (С, (х)), 1=0, 1, 


определенные на множестве полной меры, и 
Рассмотрим алгебру % подмножеств тора, атомами кото- 
рой служат параллелограммы U;, Uso, ..., Ц, и множество 
Sh | 


M\U U;. При всяком /=1, 2, ..., $ условная мера 


ipl | 
во. м гл) почти всюду равна щш (И.П С, (x) )/u, (x). В са- 


мом деле, согласно теореме 11.2, достаточно проверить, что 
почти всюду | 


-ἱ α).. Be (ПС: (x) ) 
Jim в (У Т η ro gies (13) 
k 
В любой точке x@B условная мера u(uil\ V TA) совпа- 


дает с u(U;| Οἵ (х)). Если при всех К, начиная с некоторого, 
множества U, и Ci(x) не пересекаются, то обе части равен- 
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ства (13) равны нулю. Предположим, что И, ГП] С*(х)== @ при 
бесконечно многих Κα. Так как хе В, то х—внутренняя точка 
‘параллелограмма U;. Поэтому при достаточно большом k 
_ любой расширяющийся слой параллелограмма С} (αχ), пере- 
‘секающийся с Оь, содержится в И;. Отсюда следует (см. (4)), 
что _ 
| Ис (υ) П Lt (х)) 
ве (№ (x) 


где Li (x) — сжимающийся слой параллелограмма Ci (x), про- 
ходящий через точку х, и так как С, (x) =f) Li(@), то функ- 


μ(ύ,| ο: 9) = 


ЦИИ με (Lt (x) И ue (АП Li (x)) сходятся при R->0o соответ- 
ственно к и. (С, (х)) = в: (x) и щ(И,П С, (х)). Тем самым ра- 
венство 


Uc (ИПС, (x) ) 
CAN | № Г. '- μι (x) 
доказано. 


Теперь заметим, что по построению Cyo(x)=TC, Gas 5) при 
хЕВ и ИПС, (x) = Co(x) при xe BU, а, при 
хЕВ 0 Ur 


τ μο (4). ἬΝ 
(ud Vt A) = pi (x) — λμι (x) ^ 


Отсюда, пользуясь соотношением (12.2) (см. стр. 141), полу- 
ЧИМ 


A(T, лун VT") = сы { In wi (Tx) du =Ina+ 
κ; Μ 


Aw, (x): 


+ J (In py (x) — пы (Г) ) ар. 


ae 


Левая часть этого равенства конечна, так Kak A(T, A)< 
< H(A). Значит, функция &(х) =] (х)—] #(Тх), где f(x) = 

= ши, (х), интегрируема. По теореме а левая часть 
р 


—1 


wees) = теч) 
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\ 


при №М-> со сходится почти всюду к функции 8(х), для ко- 
торой ! д (x) du = ! g(x)du. Правая же часть, как нетрудно 


αι. может аа ТОЛЬКО К А Следовательно, 
| [ε() du=0, A(T, ο) -- πλ. 
η | 


В заключение установим, что’ 


A(T, М) =Е(Т). 


Рассмотрим конечную алгебру = VTA, OES des Rage 


Любой атом этой алгебры, имеющий oe a eee Mepy, 
k 


очевидно, представим в виде U T ‘Up. Пусть д, — максималь- 
é » =—k ‘ 

ный из диаметров таких атомов. Если параллелограммы ИТ, 
GS, в Us достаточно малы, то, повторяя рассуждения пре- 


дыдущего пункта, можно показать, что Jim η ὃ, =0 и № A,X FB. 
Поэтому (см. следствие 1 на стр. 105). A(T) = lim. A(T, Ay), 


и для завершения доказательства остается РУ что 
A(T, Ay) =h(T, A) при любом Ё. В итоге получаем 


A(T) =h(T, A) =шА. 


3) Для Toro чтобы доказать, что Т является К-автомор- 


физмом, рассмотрим вместо Т сдвиг Г. Если марковское раз- 
биение В конечно, то, согласно $ 11 книги, достаточно прове- 
рить неприводимость и апериодичность матрицы Р. То же 
верно и при бесконечном В. 

В самом деле, для. неприводимой апериодической ма- 
трицы Р выполняются соотношения lim при = Py (i, 71=Ь 


2. rae ip р® — элементы матрицы P* ion: 16, стр. 384— — 385] ). 
Отсюда, пользуясь свойствами цепи Маркова и теоремой 
Дуба (см. стр. 138), нетрудно вывести, что если Я, есть 
б-алгебра событий, зависящих от поведения рассматриваемой 
цепи Маркова в моменты 1 >k, а F — произвольный цилиндр, о 
то почти всюду lim 1 fi (F | Be) =i (F). 


Пусть B πόθο. множество из с-алгебры Φ., -П 5» И 


[; —его характеристическая функция. Для В ας и для 
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всякого измеримого множества) можно подобрать такую по- 


следовательность множеств В,, что каждое В, есть объеди- 
нение конечного числа непересекающихся цилиндров и почти 
всюду ГБ, —/5 при kR— oo, т. е. почти всюду . 


lim E (Iq,|#,.)=E (Ig | #,)=Ip- 


k>oo 
По доказанному Е (Js, | ο) --μίΏῃ). Это означает, что почти 


всюду [; --μ(β) и, следовательно, р(В)=0 или 1. Таким 
образом, Т является К-автоморфизмом, если матрица Р не- 
приводима и апериодична. 
Заметим, что оба эти условия заведомо выполняются, 
если для любых В,, В, найдется такой‘ номер № (4, ]), что 
В, ПТ*В, # © при всех & > №( ]). Существование для на- 
шей матрицы чисел № (1, ]) с указанным свойством мы уста- 
новим, опираясь на лемму 2. Из нее вытекает, что для вся- 
кого #>0 найдется такое число R,, что любой шар pa- 
диуса R,, лежащий в расширяющемся слое'), является 
=-сетью для тора. В самом деле, пусть Ё-— какой-нибудь 
расширяющийся слой. Так как по доказанному он всюду 
плотен на торе, шары радиуса e/2 с центрами в точках 
слоя L образуют покрытие тора. Выделив конечное подпо- 
крытие, мы получим конечную (8/2)-сеть, состоящую из цен-. 
тров выделенных шаров. Шар O’(x), лежащий в слое L, 
с центром в заданной точке x@L и достаточно большого 
радиуса R(x, 2/2), содержит эту (e/2)-ceTb, а потому и сам. 
является (8/2)-сетью. Для любой точки x = М обозначим L (x) 
расширяющийся слой, проходящий через точку x. Пусть, x, 


Xo, ..», А — произвольная конечная (8/2)-сеть и О’ — шар pa- 
диуса R=R,= шах Ю(хь, 8/2) с центром в произвольной 
maa. 2 


_ точке x, лежащий в слое L(x). Найдем точку Χμ, для KOTO- 
рой d(x, х,)<:/2. Шар O’(x,), лежащий в слое Г. (х,), обра- 
зует (8/2)-сеть. Из неравенства Ю > Ю(хь, ε/2) следует тогда, 
что шар О” образует =-сеть. Наше’ утверждение доказано. 

Пусть теперь B;, В, — любые элементы разбиения В. Ка- 
ждое из этих множеств, будучи открытым, содержит неко- 
торый шар.’ Обозначим эти шары соответственно О; и О,, 


а их центры —х; и x; Пересечение шара О; с расширяю- 


1) Так естественно называть множество вида MO, где О — пересече- 
ние и-мерного шара радиуса Re с расширяющейся гиперплоскостью, со- 
держащей центр этого шара. 
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щимся слоем’ L(x;) есть некоторый шар О’, лежащий в слое 
L(x,). Пусть e¢=r/2, где г— радиус шара О;. Найдем соот- 
ветствующее R,. На основании леммы 1 существует такое fo, 
что при κ» Κι множество Г*О, содержит шар радиуса R,, 
лежащий в слое L(T Е По доказанному этот шар является 
ρα и, значит, пересекается с шаром Ο,. Но ΟΙ οί 


ΤΟ’ <T*B;. Следовательно, при k> Ро пересечение В, Τ᾽ В} 
непусто. рык. полностью доказана. 


$ 3. СУЩЕСТВОВАНИЕ МАРКОВСКОГО РАЗБИЕНИЯ 


1. Марковские разбиения для Ги Т”. Мы назвали раз- 
биение & на параллелограммы марковским для автомор- 


физма Т, если оно удовлетворяет условиям I’, (Γ- Τ᾽ (a), 
LAr a) cr, (a). Прежде чем строить такое разбиение, заметим, 
что достаточно найти марковское разбиение а для Т" при 
каком-нибудь т_> 01). В самом деле, пусть 


τα (Τη: ) -- в (α΄ ), Г (r"a’) ams (α’. (14) 
Множества вида | 
И, ИТ Е. 


we ПЕ: ПИ, ПТ, П.П В, 


где И:, — произвольные элементы разбиения @’, очевидно, 

также образуют разбиение тора на параллелограммы. Для 
τ" lo / oe 

этого разбиения введем обозначение A= ТГ а Уч SILOS αν 


/ / : -ἱ 7 
VaVTa Vv... УТ" a. Легко проверяются следующие 
соотношения между границами α и a’: 


m=—\? 


т-1 


m=—1 ᾿ 
Pj (а) = И Гр (7ο), Г. (a) = И Ге (T*a’). (15) 


k=—m-+1 к=—т-1 


Из (14) и (15) вытекает, что ‘а — марковское разбиение. для Г, 
причем размеры его элементов не превышают размеров со- 
ответствующих элементов разбиения a’. 


2. Разбиение, полученное из покрытия. Построим какое- 
нибудь конечное покрытие тора параллелограммами, т. е. 


') Подпространства Hp и He, а вместе с ними параллелограммы и 
границы параллелограммов, очевидно, от т не зависят. 
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систему и параллелограммов От, Uo,..., Us, дающих в сумме 
весь тор. Такая система получится, если включить каждую 
точку тора в какой-нибудь открытый параЛлелограмм, а за- 
тем выделить в случае необходимости конечное подпокрытие. 
Данный способ позволяет получить покрытие, размеры эле- 
ментов которого произвольно малы. | 
Опишем теперь один общий способ перехода от покрытия 
к разбиению, который в дальнейшем будет неоднократно 
применяться. Пусть t={X;, i=1, 2,..., $} — произвольное 
конечное семейство подмножеств некоторого множества Х и 
&; — разбиение этого множества, состоящее из двух элемен- 
тов: X; и X \ X;. Сопоставим семейству т разбиение Ё (т), 
5 


где Е(т) = У =, Ὁ). Взяв в качестве т совокупность и парал- 
= 


лелограммов U;, i=1, 2,..., $, образующих покрытие тора, 
мы получим разбиение & (и). Элементы этого разбиения уже 
не обязаны быть параллелограммами. 

Построим, исходя из покрытия и, разбиение тора на па- 
раллелограммы. Пусть И; — произвольный элемент нашего 
покрытия и U;,, 0..,..., Ui, — элементы покрытия, пересе- 


кающиеся с U;. Если размеры элементов покрытия и доста- 
точно малы, то в пространстве R” найдутся такие паралле- 
лограммы У: =(Уь Vi); Vi =(И:, Vi), sees Vin = (Vins И: }, 
"το Ui=anVi, Uii=aVi,..., Ui, =aVi, и отображение л на 
множестве V;UV; 0... UVi, является гомеоморфизмом. От- 
сюда, в частности; следует, что каждое множество из семейств 
и=(УЕПУЬ 1=1,2,..., 8} и οἵ-ἰντῃνί, 1=1, 2, ..., αὶ 
непусто. Построим описанным уже способом разбиение 8 (9; 
множества У; и разбиение ξ(υ7) множества V7. Пусть С’ — 
произвольный элемент первого из этих разбиений, а С” — 
второго. Легко видеть, что ир(9С’) = и. (9С”) = 0, и мы πο- 
лучаем некоторое разбиение C; параллелограмма И, на па- 
раллелограммы вида C=(C’, С”). Разбиение параллело- 
грамма И; =лУ,;, образованное параллелограммами вида aC, 
обозначим 11. 


') Если ἕξι, &»..., 85 — разбиения множества X, то произведение 
$ . $ 


\/ Егесть по определению разбиение множества Х, образованное множе- 
im! > 


$ ἥ 
ствами вида NN Crp где Ορ Pz произвольный элемент разбиения ἔμ, 
i=] - 
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Любой элемент разбиения E(u), содержащийся в парал-. 
лелограмме U;, состоит из элементов разбиения 1. Другими 
словами, каждый элемент разбиения "|; содержится в неко- 
тором элементе разбиения Е(и). Действительно, пусть точки 
ЖЕНА ee разным элементам разбиения Е (м) 
их =лу, Xy= Wor у, YoSVis у =(уь 91), Yo= (Yor Yo) Это 
‚значит, что perce параллелограммов у, » И sss, Vi, Най- 
дется. такой параллелограмм У,, что либо ие, у. ЕТ, 
: ; / 
либо y,EV;, YoSV;. В каждом из случаев либо точки ут, у. 
принадлежат разным элементам разбиения &(9,), либо точки 
yi, 9 — разным элементам разбиения &(9,). Но тогда точки 


у, Yo принадлежат разным элементам ‘разбиения &, и, следо- 
вательно, точки ΧΙ, хо — разным элементам разбиения 1]. 

Пользуясь доказанным утверждением, рассмотрим на ка- 
ждом элементе С+(„) разбиения Ё(и) произведение разбие- 
ний yn; по тем i, для которых σεως Οι. Полученное таким 
образом разбиение тора Ha параллелограммы обозначим @ (и). 
Заметим, что @(и) является разбиением в строгом смысле 
слова, но некоторые из его элементов. могут не иметь вну-. 
тренних точек. Выбросив эти элементы и взяв открытые ядра 
остальных, мы можем при желании получить разбиение тора 
на открытые параллелограммы в смысле $2. Это разбиение 
также будем обозначать a(t). 


3. Границы разбиения α (и). Пусть Γρ (и) = О Г, (и,), Ге (и) = 


$ 
= Ur. в) саответственио расширяющаяся и сжимаю- 

i=] 
щаяся границы покрытия и. Сейчас мы установим связь 
ΜΕ Г» (и), Ге (и) и соответствующими границами Г, (a (и) ), 

Г. (a (и)) ‘разбиения a (uw). 

Предположим, что элементы покрытия и и элементы ap ae: 
биения © (и) — открытые множества. Тогда связь между Гр (и). 
и Г, (0 (и)) выражается следующим образом: Г, (а (и)) состоит 
[19 всех граничных расширяющихся слоев элементов покры- 
тия и и тех расширяющихся слоев, которые пересекаются 
с граничными расширяющимися слоями. Аналогичное утвер- 
ждение относится к сжимающейся границе. Очевидно, дока- 
зательство достаточно провести лишь для Г, (а (и)). 


Включение Г, (и) < Г, (а(и)) следует ‘из того, что по по- 
строению г. (пгс, (a (и)) для любого i. Покажем, 
что любой расширяющийся слой параллелограмма Uj, пере- 


i 
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секающийся с граничным а О слоем некоторого 
параллелограмма U;,.Takxe входит в Г, (а (и)). Вместо U;, И, 


будем рассматривать параллелограммы V,, V;. Пусть L, = 

=(Vi, и), 1 j= Vp у’) — соответствующие расширяющиеся 
слои. Тода. у’ У и У, ПУ, == ©. Из построения. видно, 
что точка у” =у, =у, принадлежит границе одного из эле- 
ментов разбиения ξ(υ/), а множество И; состоит из элемен- 
тов разбиения &(9,). Поэтому всякая точка слоя L, = (уу ἐξ 
принадлежит Γρ(ζι) и, следовательно, aL; CT, (n,) <= Г, (а (и)). 

Обратно, пусть хе Г, (a(u)) \ Г, (и). Тогда x И, ПГ, (и) 
при некотором 2, и если y= и) я 
точка параллелограмма. V;, то ye!’ (G). Отсюда вытекает, 


что точка y” принадлежит границе некоторого элемента раз- 
биения (57). Значит, среди параллелограммов Vi pV tay ody Vi gs: 


пересекающихся с, Va найдется такой параллелограмм У, = 
= (У, Vi), что y GOV;. Ho тогда расширяющийся слой 
[1 = =(Vi, | у ет содержащий точку у, пересекается с граничным 


расширяющимся слоем L,;=(V}, у и. Тем самым наше утвер- 
ждение доказано. 


4. Марковское разбиение и марковское покрытие. Ilo 
аналогии с марковским разбиением введем‘ понятие марков- 
ского покрытия. Покрытие и тора параллелограммами мы 
будем называть марковским, если 


Г ae 'u) <I, (u), Г (we Г. (и). 


В предыдущих пунктах описан метод, позволяющий пе- 
рейти от покрытия параллелограммами к разбиению Ha па- 
раллелограммы. Выясним теперь, при каких условиях этот 
метод приводит к марковскому разбиению. 

Рассмотрим покрытие u=(U;, 0.,..., Us) тора М парал- 
лелограммами достаточно малого диаметра. Пусть хЕЦ, и 
PRE i), L.(x, ἢ -- соответственно расширяющийся и сжи- 
мающийся слои параллелограмма U;, содержащие точку x. 
Назовем покрытие и правильным относительно Т, если при 
некотором => 0 оно удовлетворяет двум условиям: 

1) для любой точки x = М найдется содержащий ее парал- 
лелограмм U,, такой, что 


d(x,’ 0L,(x, >в 4х, 9. (x, 33555; 
2) для любого i=1, 2,..., $ и любой точки x & U,° 
diam(T™'L, (x, д) τε, diam(TL,(x, i))<e. 
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Покажем, что если и — правильное марковское покрытие, 
TO а (и) — марковское разбиение. 

Здесь, как и раньше, достаточно проверить лишь одно 
из требуемых включений, например Г (Та (и) ) = Г. (a(u)) ИЛИ, 
что то же самое, ТГ. (a(u)) = Г. (α(μ)). Если хе Го (и), то 
включение Tx eT, (@(и)) очевидно, так как Г «(мт (&(и)) 
и покрытие и — марковское. Пусть x EI, (@(и)) Г с (и). Поль- 
зуясь результатом предыдущего пункта, найдем параллело- 
грамм ПО; и в нем сжимающийся слой L;=L,(x, i), содержа- 
щий х и пересекающийся с граничным сжимающимся слоем Г, 


некоторого другого параллелограмма U;. В силу правиль- 


ности покрытия и для точки Tx найдется такой параллело- 
грамм U, и в нем сжимающийся слой Lg, что Tx EL, un 
4(Тх, OL,)>e. Отсюда видно, что TL,CTL, (так как 
diam(TL;)<e) и, значит, ТЁ, (| Гь = @. Но в силу марков- 
ского свойства покрытия и любая точка множества TL; при- 


надлежит некоторому граничному сжимающемуся слою. Это 
означает, что [., пересекается с таким слоем. Следовательно, 
слой L,, а с ним и точка Tx, содержится в Г. (@ (и)). 

Таким образом, мы свели вопрос о существовании мар- 

ковского разбиения для автоморфизма Г к вопросу о суще- 
ствовании правильного марковского покрытия. Однако усло- 
вия 1) и 2), определяющие правильное покрытие, до некото- 
рой степени противоположны друг другу, и это затрудняет 
построение правильного марковского . покрытия непосред- 
ственно для Г. 
- Выход подсказывается результатом пункта 1, согласно 
которому достаточно получить марковское’ разбиение для 
автоморфизма J” при каком-нибудь ‘т > 0, что в свою оче- 
редь сводится к построению для Т" правильного марковского 
покрытия. 


ν 


5. Построение правильного марковского покрытия для Τ᾽. 
Пусть х-— любая точка тора и y=(y’, у”) — один из ее про- 
образов при отображении л. Рассмотрим при достаточно ма- 


лом => 0 параллелограмм О. (у) = --(Ος, Oc) В", где Ge: j= 
открытые шары РЕДИуСЯ = в подпространствах Нь, Н.- с цен- 
трами в точках и’, У” соответственно. Параллелограммы 
вида πο, (у) образуют открытое покрытие тора. Выделии 
из него конечное подпокрытие лО, (у1), TO, (Yo), ..., мО. (Ys) 
и после этого заменим каждый параллелограмм О. (y,) па- 
раллелограммом V,=O,,(y;), i=1, 2,..., s. Тогда паралле- 
лограммы U;=anV;,i=1, 2, ..., 8, также образуют покрытие 
тора, которое удовлетворяет первому из требований, предъ- 
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являемых к правильному покрытию. Теперь можно, поль- 
зуясь леммой 1, подобрать настолько большое т, что покры- 
тие u=(U,, ζ]ο,..., Us) станет правильным по отношению 
к автоморфизму Т” (выбор т мы в дальнейшем еще уточ- 
НИМ). 

Остается превратить наше покрытие в марковское для Т”, 
не нарушив его правильности. Для начала заметим, что 
в проведенном построении точки и, = (Yi, у”) ΜΟΧΚΗΟ было ВЫ- 


брать -так, чтобы выполнялось условие 


это непосредственно вытекает из леммы 2. Каждый парал- 


лелограмм V;, а с ним и АТИ», пересекается тогда с под- 
пространством Нр. Рассмотрим вместе с каждым ИУ, =1,2,... 
.., 5, все его сдвиги на целочисленные векторы. Получив- 
шиеся $ семейств параллелограммов образуют в совокупности 
некоторое покрытие о пространства Κ΄, причем любое orpa- 
ниченное множество в R” пересекается лишь с конечным 
числом элементов этого покрытия. Покрытие о обладает, 
очевидно, теми же свойствами правильности по отношению 


к Ат, что ии (по отношению к Т т Поэтому для каждого 
ἣ ’ м г 
selena Le ATV; =(APV;, ТИ; ) можно найти такие 


элементы V ,, = (Vip μὴ» f=, 2, ..., διν Покрытия Ὁ, что 
5; ь . 
=. / ΧΗ 
ту: = ([]У:, 0(0, OVi)>e (17) 
κ | 
и, следовательно, сим при каждом j=l, 2,..., Si 


в силу правильности Ὁ. По условию параллелограмм И;; по- 


лучается из некоторого V;, 1<15 $, сдвигом на подходящий 
целочисленный вектор 2, = (2’,. 2 "), μπι ΚΕ имеет вид δ 


Сравнивая (16) и (17), получаем оценку 
hye Ὁ ыы 


| Заменим теперь обозначение У, на У; (0) и Vj, на V;,(0). 
Пусть τ’ (0) — совокупность о У; (0), w’(0) — совокуп- 
ность множеств Vj, [ΟΕΕ so. (Pg wr Meee es es 


Г (о (©) = 7:0) (ο) -Ἡ0ν/ο ): Будем строить ин- 
дуктивно πἠσχοπομητοπεηαυτή fo" (k)} и р ИЕ 


15 Зак. 1491 
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где υ'(Κ) — совокупность множеств V/(k), i=1, 2, ..., 5, 
и’ (Κ) — совокупность множеств И, (Е), j=1, 2,..., δι, Ἡ 
у, (Е) =У; (Е) + =. Если э’(®) и и” (Е) уже построены, то по- 
ложим. а 


| eet 
УЕ = Аг" [Ὁ vise) . (19) 
Из этого определения вытекает, что для любых 4, | после“ 
довательности множеств (У; ()} и {V;,(%)} возрастают. Пусть 
γ΄ (co) =UVi(®), Vi, (оо) =U Vi, (©), O(c) = совокупность MHO- 


жеств И, (ος) И ик множеств У’, (оо). 


ее изучением свойств построенных множеств. Для 
_ этого введем величины 


4 (#) = тах diam И; (8), #=0, 1,..., оо, 
г’ (k) = тах sup ρ(ν, У, (=), k=0, 1,..., 
' уеду, (R40) 


которые, очевидно, связаны между собой неравенством 
— aA (R+1)<d’(k) + 2r’(k). По построению d’ (0) = 4e: Из леммы | 
и соотношения (19) нетрудно вывести, что 


γ΄ (0) < Δαρλη”ε, 
r’(k+1)<apAp"r' (Rk), k=0, 1,..., 
и, следовательно, Е 


γ΄ (k) < Δεθξ"', 
ο. = (20) 
α΄ (К) <4e (1+ 20, » ο), 
[=0 


где 0, =аА»”. Выбором достаточно большого т можно до- 
биться, чтобы было 9, < 1/7. Тогда 


’ 3 ‘ 7 | . θρ } 
a(x) tn a) = 4e(1+20, 4) —e( =~) <6e 
и для любого i=l, 2,..., 5 


Чат (АУ ь) <0, п ae (21) 
Теперь покажем, что Ἢ 3%, 
АТГ (0 (©°)) < Г (в (©°)) | - (22) 
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Ξε μρ([(υ΄(οο))-0. (23) 
Включение (22) следует из соотношений 


со © 5] | 
Vi (ео) =U arvie)=U-Uviie- = 
k=] : k=1 j=1 


Ὁ 


= ὄννα-υ-Ώνίνο, 
ΑἹ ὃ (Vi (οο)) = ὃ (ATV; (οο)) = | Ϊ 
в δ] 51 
—д [ὐ Vij (=) “Uo (со)) <= T'(w’(w)). 


Равенство (23) доказывается сложнее. Прежде всего за- 
ей 
метим, что множество Ar V;(k) можно представить в виде 


Uli, 4 Нар. o+ ΑΤαί,, ie. АР", ᾱ- 1); | (24) 


где 2; Ὁ 21» Se 2, p-1— проекции на Hy целочисленных. 
векторов 2; ϱ ἄτη» ἘΜῈ 2: ‚а: Это легко проверить по ин- 
дукции, вспомнив способ построения У; (Е) (см. (19)). Равен-. 
ство (24), очевидно, останется справедливым, если в левой 
его части заменить У’; (Ё) на У: (Е + 1), а в правой Vi, (0) на 
у, (1). Отсюда и из. (20) вытекает, что для любой TOUKH 


у = 0A? "у, (k+ 1) 
ρ(ν', ДАТУ; (&)) <r’ (0) < 4θγε. 
- Пусть r(k, D= Sup о (и ‚ OAV! (A)). Тогда при 
ре ν΄ = АЙТИ, (eel) 5 ep 
BCE 9 | ая 
г (Е, l)<r(k, 1)+ sup ФУ, ол Ot I< 
y ‘ету, (k+l) - 
<r(k, 1) + 8, зир ay’, ape Vet A) = 
уе) my! Ry 
=r(k, 1)+O0r(k+l,/—l=... 
-=r(k, 1) + Opr (ЕТ, ep ee ee Ue 


<40,0(1+ 0+ ... +05) < © 


O58 2 
oe 8 
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Переходя к пределу при /-—> © и фиксированном k, получаем 


г(Ё, о) = sup p(y’, АУ! (в) 5-е. = (38) 


ν΄ = дАТТУ, (ο5) 


Вернемся к покрытию Ὁ пространства ΚΝ’. Пересечения 
элементов этого покрытия с Нр образуют некоторое покры- 
‘тие о’ подпространства Нь. Построим разбиение E(v’) (см. п. 2). 
Из (16), (18) и (24) вытекает, что если т достаточно велико, 


то при любых 7, Е множество АТУ: (Е) состоит из элементов. 
5 (0). Действительно, рассмотрим вместе с множеством У’ = 


= Vi, (0) + =. o+ Ат, LOR Ne be Nee ae 2. - Параллелограмм 
У = γι; (0) + =. a+ Ата +. vee AE ee В, силу (18) 
|= ot ΑΤαι, 1+. + AP ут ры < 


< ке +) четв, (26) 


где 6. = acdc (см. лемму 1). Если т выбрано так, что 0. < 1/7, 
то в силу (16) и (26) V1) Hp # © и, следовательно, У ПН,» =V’. 
Остается вспомнить, что по определению разбиения §&(v’) 
множество V [] Ηρ состоит из элементов этого разбиения. 

Установим теперь еще одно необходимое нам свойство 
E(u’): существует конечное число элементов разбиения Ё (5), 
сдвигая которые на векторы из H,, можно получить все 
остальные элементы этого разбиения. . 

‘Сначала заметим, что аналогичным свойством обладает 
покрытие 9’. Именно, для любого его элемента У’ найдется 

. . Е ЗАЛ {ΦᾺΣ / 

такое i, 12$, что У’=И, (0) +2, где И, (0) — шар ра- 
диуса 2=, принадлежащий системе о’ (0), и 2, — вектор из Ηρ. 
Зафиксировав для каждого У” так подобранное { и выделив 
элементы с одним и тем же Ll, разобьем совокупность эле- 
ментов нашего покрытия Ha $ классов, причем элементы 
одного класса будут получаться друг из друга с помощью 
сдвигов на векторы из fp. 

Оценим, снизу длины этих векторов и их разностей. Пусть 
У: Vi, Vi- элементы соответственно 2-го и [ΓΟ классов. 


Тогда найдутся такие параллелограммы V,, Vis Vin Vy; ABJIAIO- 
щиеся элементами покрытия V, что У: =И; ЕДВ, Vi=Vi ῃ Ηρ, 
΄ / -- ~ ~ Ley - „ 
Vj=ViNn Ap Vi=ViN Ap ТУ; ="; 2ь 155 V7 AR 2); BAC 

2, = (2, 21) и г, = (2, αὐ) — целочисленные векторы. Пользуясь 
тем, что все рассматриваемые параллелограммы пересекаются 
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с Ηρ, а их проекции на Но имеют диаметр 4e, легко прове- 
рить, что если векторы 2,, 2’, 2; — 2; ненулевые, TO 


| 2; | 2 1 — 8e, | 2; | 22 — δε, |=! — = | > 1- 16ε. (27) 


Отсюда, в частности, следует, что при =< 1/12 элементы 
одного класса не могут пересекаться друг с другом. 
Рассмотрим произвольный элемент С разбиения §&(v’). Πο. 
определению С есть пересечение некоторых элементов покры- 
тия 9’ с дополнениями к остальным элементам покрытия. 
При < 1/16 элементы покрытия 9’, содержащие С, принад- 
лежат разным классам. Значит, таких элементов конечное 
число, и их можно записать в виде последовательности Vi ; 
Vi pores Vi? где индекс ἐν (v=1, 2,..., k)—HoMmep класса, 
которому принадлежит Vi, . Из (27) gueayen что при < 1/20 


κ 7 
элементы покрытия 9’, пересекающиеся с Пи, также при- 
ν--] 


é / Ren / 
надлежат разным классам. Пусть Ур, Vj,,°..., Vj, — τε эле- 
k 


: no 

менты покрытия 9’, которые пересекаются с Πν:, , HO He 
у=1 

содержат С (j,—HOMep класса, которому принадлежит Vi, ь 

ye 2:5; т тогда 


-(П и.) (П (№ у, ). 


Таким образом, мы сопоставили каждому элементу С раз- 
биения ξ(υ΄') символ 1(С)= (4, &, ..., tes Л, № ..., Л) в KO- 
тором все индексы различны: и принимают значения OT | до $. 
Так как существует лишь конечное число таких символов, 


осталось доказать, что если элементам Си С отвечает ОДИН 


и тот же символ I(C)=1(C), то С получается из С сдвигом 
на вектор, лежащий в Hp. 


Пусть Ayal Cy=ii,, io, ae ip, hi» Jo, ...) п), т, е. 


бек 
- (1 ,)п(П (HN ζ΄), 


v=] 
ЧР / ал У / | 
где Vii=Vi +2, И =И +21; iy 21, Е Ηρ. Покажем, 


/ / ΄ / / 
что все 2; и 2, совпадают с а, . Пусть И» И - любые точки 


230 ДОПОЛНЕНИЕ 


/ 2 
ИЗ Vio Vi соответственно и i; = ‚+2, у ей +2) . Из 
определения множеств Vi, у. следует, что тогда 
TCA wit, Seas Gi, I ‚< 8е, а потому ka — 2) |< 16е. 

Если 2; Ἔ =f г, ‚ то при < 1/32 это противоречит послед- 
нему из р В (27). Аналогично доказывается, что 
/ 

2 PEs miner 1, 22; ‚ Е. Итак, C= C+ 2p. 
| Следовательно, ee ё< 1/32 разбиение $ (5) обладает 
нужным нам свойством. 

Из доказанного свойства вытекает существование Ta- 
кого числа &, >0, что каждый элемент С разбиения & (5), 
имеющий положительную меру Up, содержит некоторый шар 
О: (С) радиуса ει, лежащий в Hy. При этом шар Ое (С) 
для каждого С можно выбрать так, что если С — элемент 
разбиения §&(v’), получающийся из С сдвигом на вектор 


2’ Ηρ, TO О», (С) = Oe, (С) г’. Тогда найдутся такие числа 
€,>0 u 6<1, что*е›-окрестность De, (С) аа. OC не πέος 
секается с Oc, (С) и 

Ир (D., (C) NC) 
ης Ир (С) 
Пусть №, (#) — объединение элементов разбиения ξ(υ', пере- 
секающихся с 2-окрестностью множества ОА*тУ’, (К). В силу 
неравенства (25) δ Αγ“ (οο)ς: И (Е). Из определения W, (Е) 


и оценки для r(k, 1) вытекает, что 
sup p(y’, ДАТУ: (®)) < 6 ele: oly re (k)) + 
y SAT ™W (e+) νε 


+, sup oly’, dAr"V1(k)) < < 60,6 + 40,¢ = 004e (29) 
у’едА*Ту, (+1) 


(28) 


и, следовательно, Ar"Wi(k+ 1)CW;(k), если 0, < 1/7. 
5 ο Ат W;(k+1 | 
Оценим отношение ий Пусть С — элемент 
- Ир 
разбиения &(9’”), принадлежащий №, (Е), и в» (С)>0. Если 
множество Ar Wi(k+ 1) пересекается с С и пересечение не 
содержится в Де, (С), тов Аз", (Е + 1) найдется такая точка у, 


- что о (у, AC) > ep. По доказанному OA} Vi (Е) содержится 
в объединении ae элементов разбиения ξ(υ'). Отсюда 


АЛГЕБРАИЧЕСКИЕ АВТОМОРФИЗМЫ ТОРА И ЦЕПИ МАРКОВА 231 


следует, что р(у’, ДАз”У, (Е) )> =.,. Еще раз увеличив, если это 
необходимо, число т, можно добиться выполнения усло- 


вия 100,e<e,. Неравенство (29) показывает, что тогда 
СПА”, (Е + ЕВ, (С). Используя (28), получим 


μ “(Aw (k+ 0) _ μ» (Атм, (k+ 1)) 


ОГ. 
а", ()) в, (9.6) = 


δ это значит, что im: Up (АРУ: (k)) =0. Тем самым равен- 


ство (23) а. так как OV; (со) <= Az" И: (Е) при каждом К. 


Теперь можно утверждать, что множества (V; (co), И; (0)), 
i=1,2,..., $, являются параллелограммами. Взяв их образы 
при отображении л, мы получим некоторое покрытие й тора 
параллелограммами. Каждый элемент этого покрытия со- 
держит соответствующий элемент покрытия и. Отсюда и из 
неравенства (21) вытекает, что й — правильное покрытие. 
В силу (22) й обладает одним из свойств марковского по- 


крытия, а именно 
Γ.(1"2}ε:Τ. (i). : (30) 


Чтобы получить настоящее марковское покрытие и (одно- 
временно правильное), достаточно повторить рассуждения 
этого пункта, отправляясь от й и поменяв ролями расширя- 
ющееся и сжимающееся пространства. В самом деле, по- 


строение, превращающее й в il, будет затрагивать лишь сжи- 

мающуюся границу покрытия, а потому для и вместе с вклю- 
ae; Be -ε 

чением Г, (T и)=ГЬ (и) будет выполняться и (30). Правда, 


число т при переходе от й к й придется еще несколько 
увеличить. Впрочем, из анализа изложенного доказательства 
видно, что подходящее т зависит лишь от начального по- 
крытия и и, значит, может быть. выбрано заранее. 


$ 4. МАРКОВСКИЕ РАЗБИЕНИЯ В ДВУМЕРНОМ СЛУЧАЕ 


Для автоморфизма двумерного тора можно построить ко- 
нечные марковские разбиения, не прибегая к описанному 
выше процессу последовательных приближений. Это было 
замечено Адлером и Вейссом (см. [1]). Мы приведем здесь 

т 
соответствующее построение. Пусть Ar =|’ ae Рассмотрим 
для простоты случай mg—np=1. Начало координат О есть 
неподвижная точка преобразования Г. Условие отсутствия 


| 
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собственных значений, по модулю равных 1, в двумерном 
случае сводится, как нетрудно проверить, к наличию двух 
вещественных собственных значений Ap, | № |< 1, и Ap, | № [> 1, 
каждое из которых иррационально. Отвечающие им соб- 
ственные направления имеют иррациональные тангенсы’ 
углов наклона. 

Рассмотрим более внимательно расширяющийся и сжи- 
мающийся слои L, и Ly, проходящие через точку О. Допу- 


стим, что № >0, Ap >0 и что нам удалось построить такое 


разбиение α Ha sa Sees что Г. (a) =T, есть отрезок 

слоя [‹, содержащий O, а Г, (9) =Г, есть отрезок слоя Ly, 

также содержащий О. Τοῦ. ева непременно будет 
—1 

марковским, поскольку ТГ. =Г., Т Ге Г,. 

Мы сейчас увидим, что существуют разбиения тора на два 
параллелограмма с указанным свойством. Вообще говоря, 
таких разбиений счетное множество. 

Будем считать слои L, и Ly ориентированными. Рассмот- 


рим два ориентированных отрезка ГД и Г.Е», выхо- 


дящих из точки О и пересекающихся в точке O,'), причем О, 
служит конечной точкой для обоих отрезков. Проведем затем 
из точки О в направлении, противоположном направлению I’, 
отрезок Г. вплоть до первого пересечения с I’. Пусть это 
пересечение произошло в точке Ου. Ясно, что на I’, точка Oy 
лежит между О и ΟΙ. 

Пусть Г. =Г;()Г.. Заметим, что Г. — отрезок сжимающе- 
гося слоя, содержащий точку О внутри себя. Наконец про- 
должим р. в первоначальном направлении вплоть до первого 
пересечения с Г. (в точке О.) и полученный отрезок обозна- 
чим I’). Нетрудно убедиться непосредственно, что отрезки Г. 


и Г, разбивают тор на два параллелограмма, которые мы οὔο- 


значим U и И”. Расширяющиеся стороны одного параллело- 
грамма суть отрезки OO, и O03, а другого — отрезки ОО. 
и O,O,. В силу сказанного выше построенное разбиение α 
на два параллелограмма будет марковским. 

Однако разбиение α не совсем удобно, так как элементы 


_ разбиений T*aV ... УГа могут оказаться несвязными и 
их диаметры не будут стремиться к нулю при k, [-—> 05. 
Чтобы исправить положение, введем разбиение В, элементами 
которого служат связные компоненты элементов разбиения 
a\/ Та. Эти связные компоненты будут по-прежнему парал- 


1) В топологической теории динамических систем такие точки, следуя 
Пуанкаре, называют гомоклиническими, 
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лелограммами, сжимающиеся границы которых содержатся 
°в сжимающихся границах параллелограммов U, И”. Разбие- 
ние В будет марковским (см. п. 1, $ 3). Нетрудно показать, 


1 - 
что при любых К, [> 0 элементы разбиения Be=T Ἕν... УТВ 
представляют собой связные параллелограммы, диаметры 
которых стремятся к нулю при К, [-—> oo. 


Замечание. Адлер и Вейсс [1] установили, что два 
автоморфизма двумерного тора, у которых совпадают модули 
собственных значений, метрически изоморфны. Известно, что 
существуют автоморфизмы двумерного тора с таким свой- 
ством, алгебраически неизоморфные. Из одной теоремы 
Арова [3] вытекает, что этот метрический изоморфизм можно 
установить только при помощи разрывного (но, конечно, из- 
меримого) отображения тора на себя. Отметим, что не выяс- 
нено, к какому классу Бэра принадлежит это отображение. 
Перенесение результатов Адлера и Вейсса на многомерный 
случай является, по-видимому, трудной задачей. 


- 
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